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FOREWORD 


以 最 低 的 成 本 、 最 快 的 速度 、 最 好 的 质量 开发 出 适合 各 种 应 用 需求 的 软件 ,必须 遵循 软 
件 工 程 的 原则 ,设计 出 高 效率 的 程序 。 一 个 高 效 的 程序 不 仅 需 要 编程 技巧 ,更 需要 合理 的 数 
据 组 织 和 清晰 高 效 的 算法 。 这 正 是 计算 机 科学 领域 里 数据 结构 与 算法 设计 所 研究 的 主要 内 
容 。 一 些 著名 的 计算 机 科学 家 在 有 关 计 算 机 科学 教育 的 论述 中 提出 ,计算 机 科学 是 一 种 创 
造 性 思维 活动 ,其 教育 必须 面向 设计 。 计 算 机 算法 设计 与 分 析 正 是 一 门面 向 设计 , 且 处 于 计 
算 机 科学 与 技术 学 科 核 心地 位 的 教育 课程 。 通 过 对 计算 机 算法 系统 的 学 习 与 研究 ,理解 和 
掌握 算法 设计 的 主要 方法 ,培养 对 算法 的 计算 复杂 性 进行 正确 分 析 的 能 力 , 为 独立 地 设计 算 
法 和 对 给 定 算法 进行 复杂 性 分 析 竟 定 坚 实 的 理论 基础 ,对 从 事 计算 机 系统 结构 、 系 统 软件 和 
应 用 软件 研究 与 开发 的 科技 工作 者 是 非常 重要 和 必 不 可 少 的 。 为 了 适应 我 国 21 世纪 计算 
机 人 才 培 养 的 需要 ,结合 我 国 高 等 学 校 教 育 工作 的 现状 ,立足 培养 学 生 能 跟 上 国际 计算 机 科 
学 技术 的 发 展 水 平 ,更 新 教学 内 容 和 教学 方法 ,本 书 以 算法 设计 策略 为 知识 单元 ,系统 地 介 
绍 计算 机 算法 的 设计 方法 与 分 析 技 巧 ,以 期 为 计算 机 科学 与 技术 学 科 的 学 生 提供 一 个 广泛 
而 坚实 的 计算 机 算法 基础 知识 。 

全 书 共 分 11 章 。 在 第 1 章 中 首先 介绍 算法 的 基本 概念 ,接着 简要 闸 述 算法 的 计算 复杂 
性 和 算法 的 描述 ,然后 围绕 设计 算法 常用 的 基本 设计 策略 组 织 第 2 章 至 第 10 章 的 内 容 。 第 
2 章 介绍 递归 与 分 治 策略 ,这 是 设计 有 效 算 法 最 常用 的 策略 ,是 必须 掌握 的 方法 。 第 3 童 是 
动态 规划 算法 ,以 具体 实例 详 述 动态 规划 算法 的 设计 思想 .适用 性 以 及 算法 的 设计 要 点 。 第 
4 章 介绍 贪心 算法 ,这 也 是 一 种 重要 的 算法 设计 策略 , 它 与 动态 规划 算法 的 设计 思想 有 一 定 
的 联系 ,但 其 效率 更 高 。 按 贪心 算法 设计 出 的 许多 算法 能 导致 最 优 解 ,其 中 有 许多 典型 问题 
和 典型 算法 可 供 学 习 和 使 用 。 第 5 章 和 第 6 章 分 别 介绍 回溯 法 和 分 支 限界 法 ,这 两 章 所 介 
绍 的 算法 适合 处 理 难 解 问题 ,其 解 题 的 思想 各 具 特 色 ,值得 学 习 和 掌握。 第 7 章 介 绍 概率 算 
法 ,对 许多 难 解 问题 提供 高 效 的 解决 途径 ,是 有 很 高 实用 价值 的 算法 设计 策略 。 第 8 章 介 绍 
NP 完全 性 理论 和 解 NP 难 问题 的 近似 算法 。 首 先 介绍 计算 模型 .确定 性 和 非 确定 性 图 灵 
机 ,然后 进一步 深入 介绍 NP 完全 性 理论 ,最 后 介绍 解 NP 难 问题 的 近似 算法 ,这 是 当前 计 
算 机 算法 领域 的 热门 研究 课题 ,具有 很 高 的 实用 价值 。 第 9 章 介绍 有 关 串 和 序列 的 高 效 算 
法 。 第 10 章 通过 实例 介绍 算法 设计 中 常用 的 算法 优化 策略 。 最 后 ,在 第 11 章 介绍 算法 设 
计 中 较 新 的 研究 领域 一 一 在 线 算法 设计 。 

在 本 书 各 章 的 论述 中 ,首先 介绍 一 种 算法 设计 策略 的 基本 思想 ,然后 从 解决 计算 机 科学 
与 应 用 中 出 现 的 实际 问题 人手, 由 简 到 繁 地 描述 几 个 经 典 的 精巧 算法 ,同时 对 每 个 算法 所 需 
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要 的 时 间 和 空间 进行 分 析 。 这 样 使 读者 既 能 学 到 一 些 常用 的 精巧 算法 ,又 能 通过 对 算法 设 
计策 略 的 反复 应 用 ,牢固 掌握 这 些 算 法 设计 的 基本 策略 ,以 期 收 到 融会 贯通 之 效 。 在 为 各 种 
算法 设计 策略 选择 用 于 展示 其 设计 思想 与 技巧 的 具体 应 用 问题 时 ,本 书 有 意 重复 选择 某 些 
经 典 问题 ,使 读者 能 深刻 地 体会 到 一 个 问题 可 以 用 多 种 设计 策略 求解 。 同 时 ,通过 对 解 同 一 
问题 的 不 同 算法 的 比较 ,更 容易 体会 到 每 一 个 具体 算法 的 设计 要 点 。 随 着 本 书 内 容 的 逐步 
展开 ,读者 也 将 进一步 感受 到 综合 应 用 多 种 设计 策略 可 以 更 有 效 地 解决 问题 。 

本 书 采用 面向 对 象 的 Java 语言 作为 表述 手段 ,在 保持 Java 优点 的 同时 ,尽量 使 算法 的 
描述 简明 清晰。 

为 了 便于 读者 加 深 对 知识 的 理解 ,各 章 配 有 难 易 适 当 的 习题 ,以 适应 不 同 程度 读者 练习 

在 本 书 的 编写 过 程 中 ,得 到 教育 部 高 等 学 校 计算 机 类 专业 教学 指导 委员 会 的 关心 和 支 
持 。 福 州 大 学 “211 工程 ?计算 机 与 信息 工程 重点 学 科 实验 室 和 福建 工程 学 院 为 本 书 的 写作 
提供 了 优良 的 设备 与 工作 环境 。 清 华 大 学 出 版 社 负责 本 书 编辑 出 版 工作 的 全 体 人 员 为 本 书 
的 出 版 付出 了 大 量 辛勤 劳动 ,他 们 认真 细致 一 丝 不 苟 的 工作 精神 保证 了 本 书 的 出 版 质量 。 
南京 大 学 宋 方 敏 教授 和 福州 大 学 傅 清 祥 教 授 在 百 忙中 认真 审阅 了 全 书 , 提 出 了 许多 宝贵 的 
改进 意见 。 在 此 , 谨 向 每 一 位 曾经 关心 和 支持 本 书 编写 工作 的 各 方面 人 士 表示 更 心 的 谢意 ! 

由 于 作者 的 知识 和 写作 水 平 有 限 ,书稿 虽 几经 修改 , 仍 难免 存在 缺点 。 热 忱 欢迎 同行 专 
家 和 读者 惠 予 批评 指正 ,使 本 书 在 使 用 过 程 中 不 断 改进 ,日 至 完善 。 


作 者 
2018 年 6 月 


Ce ANIES 


习题 … 


共生 
表达 算法 的 抽象 机 制 … 
往 活 委 当 以 六 炳 i 


递归 与 分 治 策 略 oestrus 16 


分 治 法 的 基本 思想 

二 分 搜索 技术 … 
大 整数 的 乘法 ……… . 
棋 答 覆 疙 i 26 
线性 时 间 选 择 ……… . 
最 接近 点 对 间 题 eee 35 


pe sb oR EN 


El! ee 
动态 规划 算法 的 基本 要 素 … 
最 长 公共 子 序列 oo 
凸 多边 形 最 优 三 角 训 分 … 
多 边 形 游戏 64 


算法 设计 与 分 折 ( 艇 工厂 ) 


3.6 
3.7 
3.8 
3 和 9 
3.10 


小 结 


闻 往 国贸 sioner 
电路 布线 69 
i 
RT 
TE 8 
罗 3 

83 


六 已 匀 法 i 


活动 安排 间 题 …eee 5 
4.2.3 人 心算 法 与 动态 规划 算法 的 差异 - 89 
91 
哈 夫 曼 编码 …… 92 
最 小 生成 树 … ee 99 
4.6.1 最 小 生成 树 性 质 … … 99 
4.6.2 Prim 算法 ……… .00 
4.6.3 Kruskal 算法 ee 102 
4.8.2 带 权 拟 阵 的 贪心 算法 … 107 
4.8.3 ”任务 时 间 表 问题 … 109 

TE .113 
“a 1 


5.1.1 tt aeaase nn aiit stat naa lS 


忆 oo 中 mw 


一 
Le 


5.1.4 和 迭代 回溯 … 1118 
S15 子 集 树 与 排列 酝 : 人 ee Ll9 
装载 问题 0 
批 处 理 作业 调度 126 
符号 三 朋 形 网 题 0 5 且 Eee 提 
0-1 背包 问题 
最 大 团 问题 … 
图 的 mn 着色 问题 … 国 
六 闪 全 网 问题 -et 提交 向 
连续 邮资 问题 147 
回溯 法 的 效率 分 析 - 


分 支 限 界 法 的 基本 思想 ere 153 
单 源 最 短路 径 问 题 e156 
0-1 背包 问题 

旅行 售货员 问题 … Se 


概率 算法 190 


算法 设计 与 分 折 ( 荔 工厂 ) 


7 
7. 5.1 这 特 卡 罗 算法 的 基本 思想 eee 
7.5.2 主 元 素 问 题 呈 es 


7.5.3 素数 测试 …- 


第 8 章 NE 完全 性 理论 与 近似 算法 .4 


8.1.2 P 类 与 NP 类 语言 
8.1.3 ”多项式 时 间 验 证 
8.2 NP 完全 问题 …………… 


8.2.2 Cook 定理 ee 


合 取 范式 的 可 满足 性 问题 … 


lL 

2 

.3 团 问题 … 

.4 顶点 覆盖 问题 

5 子 集 和 问题 … 

.6 哈密 顿 回路 问题 
8.3.7 旅行 售货员 问题 … 

8.4 近似 算法 的 性 能 

8.5 顶点 覆盖 问题 的 近似 算法 

8.6 ”旅行 售货员 问题 近似 算法 


和 
oo oo oo 


8.6.1 具有 三 角 不 等 式 性 质 的 旅行 售货员 问题 … 


8. 6.2 一 般 的 旅行 售货员 问题 … 
8.7 集合 覆盖 问题 的 近似 算法 …… 


8.8 子 集 和 问题 的 近似 算法 pp 
8.8.1 子 集 和 问题 的 指数 时 间 算 法 … eee 
和 子 集 和 问题 的 完全 多 项 式 时 间 近 似 格式 :pp 


小 


3 元 合 取 范式 的 可 满足 性 问题 … sossesssssososesseaseassessssssesees 


第 9 章 


.1 


六 汪 


9.3 


ns a 
2 RR RO 


第 10 章 


10,.1 


10.2 


10.3 


10.4 


市 与 序列 闪 竹 法 npn 


ee nin eset ed 
9 汪汪 “ 审 的 站 本 概念 manneie nnd iii 
9.1.3 Rabin-Karp 算法 2258 
9.1.4 多 子 串 搜索 与 AC 自动 机 … 

后 缀 数组 与 最 长 公共 子 串 …: 
9.2.1 后 缀 数组 的 基本 概念 ……… 图 
9.2.2 ”构造 后 级 数组 的 们 前缀 算法 … 267 
人 总 | DC3 分 汉 法 hi 
序列 比较 算法 i 
9.3.1 编辑 距离 算法 …… 

9.3.2 最 长 公共 单调 子 序列 和 

9. 3.3 ”有 约 东 最 长 公共 子 序列 间 pp 281 


算法 优化 策略 


10.1.1 最 大 子 段 和 问题 的 简单 算法 … * 
10.1.2 最 大 子 段 和 问题 的 分 治 算法 …… 
10.1.3 ”最 大 子 段 和 问题 的 动态 规划 算法 …… i 
10.1.4 ”最 大 子 段 和 问题 与 动态 规划 算法 的 推广 … a 
动态 规划 加 速 原理 … 让 
10.2.1 货物 储 运 问题 … 94 
问题 的 算法 特征 ……… 
10. 3. 1 贪心 策略 ……… 
10.3.2 对 贪心 策略 的 改进 … : 
10.3.3 算法 三 部 昌 和 299 
10.4.1 带 权 区 间 最 短路 问题 306 
0 人 法 役 评 蚌 起 aspaslasaeaaastannnas 语 ca 二 0@ 


算法 说 计 与 分 折 ( 艇 工厂 ) 


10.4.4 ”并 查 集 0 
10.4.5 可 并 优先 队列 
10.5 “优化 搜索 策略 ee 


小 结 … 


习题 


第 11 章 在线 算法 设计 


11.1 “在线 算法 设计 的 基本 概念 


11.2 页 调度 问题 ……………… 


11;3， 势 函 数 分 本 5660 


11.4.3 对称 移动 算法 
11.5 Steiner 树 问题 …… 
11.6 在 线 任务 调度 …- 


小 结 … 


类 客 ne 


311 


330 
330 


算法 引 论 


1.1 算法 与 程序 


对 于 计算 机 科学 来 说 ,算法 (algorithm) 的 概念 至 关 重 要 。 通 俗 地 讲 , 算 法 是 指 解决 问 
题 的 方法 或 过 程 。 严 格 地 讲 ,算法 是 满足 下 述 性 质 的 指令 序列 。 

(1) 输入 : 有 零 个 或 多 个 外 部 量 作为 算法 的 输入 。 

(2) 输出 : 算法 产生 至 少 一 个 量 作 为 输出 。 

(3) 确定 性 : 组 成 算法 的 每 条 指令 是 清晰 的 、 无 歧义 的 。 

(4) 有 限 性 : 算法 中 每 条 指令 的 执行 次 数 有 限 ,执行 每 条 指令 的 时 间 也 有 限 。 

程序 (program) 与 算法 不 同 。 程 序 是 算法 用 某 种 程序 设计 语言 的 具体 实现 。 程 序 可 以 
不 满足 算法 的 性 质 (4) 即 有 限 性 。 例 如 操作 系统 , 它 是 在 无 限 循 环 中 执行 的 程序 ,因而 不 是 
算法 。 然 而 可 把 操作 系统 的 各 种 任务 看 成 一 些 单独 的 问题 ,每 一 个 问题 由 操作 系统 中 的 一 
个 子 程序 通过 特定 的 算法 实现 ,该 子 程序 得 到 输出 结果 后 便 终止 。 


1.2 表达 算法 的 抽象 机 制 


算法 层出不穷 ,变化 万 千 , 其 对 象 数据 和 结果 数据 名 目 繁多 ,不 胜 枚 举 。 最 基本 的 有 布 
尔 值 数据 、 字 符 数据 、 整 数 和 实数 等 ; 稍 复杂 的 有 向 量 、 和 矩阵 ,记录 等 ;更 复杂 的 有 和 集合 、 树 和 
图 ,还 有 声音 、 图 形 、 图 像 等 数据 。 

算法 的 运算 种 类 五 花 八 门 , 多 姿 多彩 。 最 基本 的 有 赋值 运算 、 算 术 运 算 、 人 逻辑 运算 和 关 
系 运算 等 ; 稍 复杂 的 有 算术 表达 式 和 逻辑 表达 式 等 ;更 复杂 的 有 函数 值 计 算 、 向 量 运 算 、 矩 阵 
运算 ,集合 运算 ,以 及 表 、 栈 ,队列 , 树 和 图 的 运算 等 ;此 外 ,还 可 能 有 以 上 列举 的 运算 的 复合 
和 嵌 套 。 

高 级 程序 设计 语言 在 数据 、 运 算 和 控制 三 方面 的 表达 中 引入 许多 使 之 十 分 接近 算法 语 
言 的 概念 和 工具 ,具有 抽象 表达 算法 的 能 力 。 高 级 程序 设计 语言 的 主要 好 处 如 下 : 

(1) 高 级 语言 更 接近 算法 语言 ,易学 、 易 掌握 ,一 般 工 程 技术 人 员 只 需 几 周 时间 的 培训 
就 可 以 胜任 程序 员 的 工作 。 

(2) 高 级 语言 为 程序 员 提 供 了 结构 化 程序 设计 的 环境 和 工具 ,使 得 设计 出 来 的 程序 可 
读 性 好 ,可 维护 性 强 、 可 靠 性 高 。 

(3) 高 级 语言 不 依赖 于 机 器 语言 ,与 具体 的 计算 机 硬件 关系 不 大 ,因而 所 写 出 来 的 程序 
可 植 性 好 、 重 用 率 高 。 
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(4) 把 繁杂 琐碎 的 事务 交 给 编译 程序 ,所 以 自动 化 程度 高 ,开发 周期 短 ,程序 员 可 以 集 
中 时 间 和 精力 从 事 更 重要 的 创造 性 劳动 ,提高 程序 质量 。 

算法 从 非 形式 的 自然 语言 表达 形式 转换 为 形式 化 的 高 级 语言 是 一 个 复杂 的 过 程 , 仍 然 
要 做 很 多 繁杂 琐碎 的 事情 ,因而 需要 进一步 抽象 。 

对 于 一 个 明确 的 数学 问题 ,设计 它 的 算法 ,总 是 先 选 用 该 问题 的 一 个 数据 模型 。 接 着 弄 
清楚 该 问题 数据 模型 在 已 知 条 件 下 的 初始 状态 和 要 求 的 结果 状态 ,以 及 这 两 个 状态 之 间 的 
隐 含 关系 。 然 后 探索 从 数据 模型 的 已 知 初 始 状态 到 达 要 求 的 结果 状态 所 需 的 运算 步 又。 这 
些 运算 步骤 就 是 求解 该 问题 的 算法 。 

按照 自 顶 向 下 .逐步 求 精 的 原则 ,在 探索 运算 步骤 时 ,首先 应 该 考虑 算法 顶层 的 运算 步 
又 ,然后 再 考虑 底层 的 运算 步 又。 所 谓 项 层 运算 步骤 是 指定 义 在 数据 模型 级 上 的 运算 步 又， 
或 称 宏观 步 又。 它们 组 成 算法 的 主干 部 分 ,这 部 分 算法 通常 用 非 形式 的 自然 语言 表达 。 其 
中 ,涉及 的 数据 是 数据 模型 中 的 变量 ,暂时 不 关心 它 的 数据 结构 ;涉及 的 运算 以 数据 模型 中 
的 数据 变量 作为 运算 对 象 ,或 作为 运算 结果 ,或 二 者 兼 而 为 之 ,简称 为 定义 在 数据 模型 上 的 
运算 。 由 于 暂时 不 关心 变量 的 数据 结构 ,这 些 运 算 都 带 有 抽象 性 质 ,不 含 运算 细节 。 所 谓 底 
层 运 算 步 又 ,是 指 项 层 抽象 运算 的 具体 实现 。 它 们 依赖 于 数据 模型 的 结构 ,依赖 于 数据 模型 
结构 的 具体 表示 。 因 此 ,底层 运算 步 又 包括 两 部 分 : 一 是 数据 模型 的 具体 表示 ;二 是 定义 在 
该 数据 模型 上 的 运算 的 具体 实现 。 底 层 运算 可 以 理解 为 微观 运算 。 底 层 运算 是 顶层 运算 的 
细 化 ;底层 运算 为 顶层 运算 服务 。 为 了 将 顶层 算法 与 底层 算法 隔 开 , 使 二 者 在 设计 时 不 互相 
牵制 .互相 影响 ,必须 对 二 者 的 接口 进行 抽象 。 让 底层 只 通过 接口 为 顶层 服务 , 顶层 也 只 通 
过 接口 调用 底层 运算 。 这 个 接口 就 是 抽象 数据 类 型 (abstract data types, ADT)。 

抽象 数据 类 型 是 算法 设计 的 重要 概念 。 严 格 地 说 , 它 是 算法 的 一 个 数据 模型 连同 定义 
在 该 模型 上 并 作为 算法 构件 的 一 组 运算 。 这 个 概念 明确 地 把 数据 模型 与 该 模型 上 的 运算 紧 
密 地 联系 起 来 。 事 实 正 是 如 此 ,一 方面 ,数据 模型 上 的 运算 依赖 于 数据 模型 的 具体 表示 , 数 
据 模 型 上 的 运算 以 数据 模型 中 的 数据 变量 为 运算 对 象 ,或 作为 运算 结果 ,或 二 者 兼 而 为 之 ; 
另 一 方面 ,有 了 数据 模型 的 具体 表示 ,有 了 数据 模型 上 运算 的 具体 实现 ,运算 的 效率 随 之 确 
定 。 如 何 选择 数据 模型 的 具体 表示 使 该 模型 上 各 种 运算 的 效率 都 尽 可 能 高 ? 很 明显 ,对 于 
不 同 的 运算 组 ,为 使 该 运算 组 中 所 有 运算 的 效率 都 尽 可 能 高 ,其 相应 的 数据 模型 的 具体 表示 
将 不 同 。 在 这 个 意义 下 ,数据 模型 的 具体 表示 又 反 过 来 依赖 于 数据 模型 上 定义 的 运算 。 特 
别 是 当 不 同 运算 的 效率 互相 制约 时 ,还 必须 事先 将 所 有 的 运算 相应 的 使 用 频 度 排序 ,让 所 选 
择 的 数据 模型 的 具体 表示 优先 保证 使 用 频 度 较 高 的 运算 有 较 高 的 效率 。 数 据 模型 与 定义 在 
该 模型 上 的 运算 之 间 存 在 的 这 种 密 不 可 分 的 联系 ,是 抽象 数据 类 型 概念 产生 的 背景 和 依据 。 

使 用 抽象 数据 类 型 带 给 算法 设计 的 好 处 主要 有 : 

(1) 算法 顶层 设计 与 底层 实现 分 离 .使 得 在 进行 顶层 设计 时 不 考虑 它 所 用 到 的 数据 、 运 
算 表 示 和 实现 ; 反 过 来 ,在 表示 数据 和 实现 底层 运算 时 ,只 要 定义 清楚 抽象 数据 类 型 而 不 必 
考虑 在 什么 场合 引用 它 。 这 样 做 使 得 算法 设计 的 复杂 性 降低 了 ,条 理性 增强 了 。 既 有 助 于 
迅速 开发 出 程序 原型 ,又 使 开发 过 程 少 出 差错 ,程序 可 靠 性 高 。 

(2) 算法 设计 与 数据 结构 设计 隔 开 ,人 允许 数据 结构 自由 选择 ,从 中 比较 ,优化 算法 效率 。 

(3) 数据 模型 和 该 模型 上 的 运算 统一 在 抽象 数据 类 型 中 ,反映 它们 之 间 内 在 的 互相 依 
赖 和 互相 制约 的 关系 ,便于 空间 和 时 间 耗 费 的 折 中 ,可 以 灵活 地 满足 用 户 要 求 。 
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(4) 由 于 顶层 设计 和 底层 实现 局 部 化 ,在 设计 中 出 现 的 差错 也 是 局 部 的 ,因而 容易 查找 
和 纠正 差错 。 在 设计 中 常常 要 做 的 增 、 删 \ 改 也 都 是 局 部 的 ,因而 也 都 容易 进行 。 因 此 ,用 抽 
象 数 据 类 型 表述 的 算法 具有 很 好 的 可 维护 性 。 

(5) 算法 自然 呈现 模块 化 ,抽象 数据 类 型 的 表示 和 实现 可 以 封装 ,便于 移植 和 重用 。 

(6) 为 自 顶 向 下 、 逐 步 求 精 和 模块 化 提供 有 效 途 径 和 工具 。 

(7) 算法 结构 清晰 ,层次 分 明 ,便于 算法 正确 性 的 证 明和 复杂 性 的 分 析 。 


1.3 描述 算法 


描述 算法 可 以 有 多 种 方式 ,如 自然 语言 方式 、 表 格 方式 等 。 在 本 书 中 ,采用 Java 语言 描 
述 算法 。Java 语言 的 优点 是 类 型 丰富 ,语句 精练 ,具有 面向 过 程 和 面向 对 象 的 双重 特点 ,可 
以 充分 利用 抽象 数据 类 型 这 一 有 力 工具 表述 算法 。 用 Java 描述 算法 可 使 整个 算法 结构 紧 
次 ,可 读 性 强 。 在 本 书 中 ,有 时 为 了 更 好 地 阐明 算法 的 思路 ,还 采用 Java 与 自然 语言 相 结 合 
的 方式 描述 算法 ,本 节 简 要 概述 Java 语言 的 若干 重要 特性 。 

1. Java 程序 结构 

1) 应 用 程序 和 applet 

Java 程序 有 两 种 类 型 : 应 用 程序 (stand-alone program) 和 applet。Java 应 用 程序 一 定 
有 一 个 主 方法 main ,而 applet 的 主 方法 名 为 init。 

Java 应 用 程序 可 在 命令 行 中 用 命令 语句 


java programName 


来 执行 ,其 中 programName 是 应 用 程序 名 。 在 执行 Java 应 用 程序 时 ,系统 自动 调用 应 用 程 
序 的 主 方法 main 。 

Java 的 applet 必须 幅 入 HTML 文件 ,由 Web 浏览 器 或 applet 阅读 器 来 执行 。 在 执行 
applet 时 ,系统 自动 调用 applet 的 主 方法 init。 

Java 程序 必须 先 编译 后 执行 。 系 统 在 编译 时 ,将 Java 源 程 序 转化 为 Java 字 节 码 
(bytecode) 。Java 源 程序 文件 的 扩展 名 为 java, 编 译 后 字 节 码 文 件 的 扩展 名 为 class。 

Java 字 节 码 可 以 看 作 在 一 台 虚 拟 计算 机 即 Java 虚拟 机 (JVM) 上 运行 的 语言 。 本 地 计 
算 机 通过 Java 虚拟 机 解释 运行 Java 程序 。 

2) 包 

Java 程序 和 类 可 以 包 (packages) 的 形式 组 织 管理 。Java 自 带 的 包 有 java. awt,java. io， 
java. lang,java. util 等 。Java 用 户 可 根据 需要 将 自己 的 程序 组 织 成 适合 各 种 应 用 的 包 。 

3) import 语句 

在 Java 程序 中 可 以 用 import 语句 加 载 所 需 的 包 。 例 如 ,import java. io. * ;语句 加 载 
java. io 包 。 请 句 import java. io. PrintStream; 则 加 载 java. io 包 中 的 PrintStream 类 。 

2. Java 数据 类 型 

Java 基本 数据 类 型 如 表 1-1 所 示 。 

除了 基本 数据 类 型 ,Java 还 提供 一 些 经 过 包装 的 非 基 本 数据 类 型 ,如 Byte，Integer， 
Boolean ，String 等 。 
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表 1-1 Java 基本 数据 类 型 


类 型 默认 值 分 配 空间 /位 取 值 范围 
boolean false 1 true, false 
byte 0 8 一 128 一 十 127 
char \u0000 16 \u0000~\uFFFF 
double 0.0 64 土 4. 9X10 ~ 土 1. 8X10™ 
float 0.0 32 士 1.4X10-65 一 土 3. 4X10* 
int 0 32 一 2 147 483 648 一 2 147 483 647 
long 0 64 一 9.2X107 一 十 9.2X107 
short 0 16 一 32 768 一 32 767 


Java 处 理 基 本 数据 类 型 和 非 基本 数据 类 型 的 方式 大 不 相同 。 在 声明 一 个 具有 基本 数 
据 类 型 的 变量 时 ,自动 建立 该 数据 类 型 的 对 象 (或 称 实例 ) 。 例 如 ,语句 int &; 建 立 一 个 数据 
类 型 为 int 的 对 象 &, 其 默认 值 为 0。 对 非 基本 数据 类 型 ,情况 则 不 一 样 。 语 句 String ;并 
不 建立 具有 数据 类 型 String 的 对 象 ,而 是 建立 一 个 数据 类 型 为 String 的 引用 对 象 (内 存 地 
址 )。 该 引用 对 象 的 名 字 是 ;, 其 初始 值 为 null。 数 据 类 型 为 String 的 对 象 可 用 下 面 的 new 
语句 建立 。 

s=new String(”"Welcome’); 

String s 一 new String("Welcome'); 
其 中 ,第 一 个 语句 假设 ;已 经 声明 过 ;第 二 个 语句 声明 变量 ;, 并 用 new 语句 建立 对 象 。 

其 他 非 基 本 数据 类 型 对 象 的 声明 和 建立 方式 与 此 类 似 。 

3. 方法 

在 Java 语 言 中 ,执行 特定 任务 的 函数 或 过 程 统称 为 方法 (methods)。 例 如 ,Java 的 
Math 类 给 出 的 常见 的 数学 计算 的 方法 如 表 1-2 所 示 。 

表 1-2 Java 的 Math 类 常见 的 数学 计算 方法 


方 法 功 能 省 续 功 能 
abs(z) 工 的 绝对 值 max(zyy) 工 和 y 中 较 大 者 
ceil(z) 不 小 于 的 最 小 整数 min(zyy) 工 和 > 中 较 小 者 
cos(z) 工 的 余弦 powCzyy) zx 
exp(z) e sin(z) 工 的 正弦 
floor(z) 不 大 于 工 的 最 大 整数 sqrt(z) 工 的 平方 根 
log(z) 工 的 自然 对 数 tan(z) 工 的 正切 


对 计算 表达 式 。+9 4 一 9 全 的 自 定义 方法 ab 描述 如 下 : 


public static int ab(int a, int b) 
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{ 
return (atb++ Math. abs(a—b))/2; 


} 章 

1) 方法 的 参数 

上 述 方法 ab 中 ,a 和 2 是 形式 参数 ,在 调用 方法 时 通过 实际 参数 赋值 。Java 中 所 有 方 
法 的 参数 均 为 值 参 数 。 在 调用 方法 时 先 将 实际 参数 的 值 复制 到 形式 参数 中 ,然后 再 执行 调 
用 。 因 此 ,在 执行 调用 后 ,实际 参数 的 值 不 变 。 

2) 方法 重 载 

方法 的 参数 个 数 以 及 各 参数 的 类 型 定义 了 该 方法 的 签名 。 例 如 ,上 述 方法 ab 的 签名 为 
(int,int)。Java 允许 方法 重 载 , 即 允 许 定义 有 不 同 签名 的 同名 方法 。 上 面 的 方法 ab 可 以 重 
载 如 下 : 

public static double ab(double a, double b) 

{ 


return (a 十 b 十 Math. abs(a—b))/2.0; 
} 


Java 解释 器 根据 方法 调用 时 实际 参数 的 签名 选用 确定 的 方法 。 
4. 异常 
Java 的 异常 (exception) 提 供 了 一 种 处 理 错 误 的 简洁 的 方法 。 当 程序 发 现 一 个 错误 时 ， 
就 引发 一 个 异常 ,以 便 在 程序 最 合适 的 地 方 捕获 异常 并 进行 处 理 。 例 如 ,方法 ab 要 求 输入 
参数 均 为 正 整数 时 ,可 将 方法 ab 修改 如 下 : 
public static int ab(int a, int b) 
{ 
if (a< 一 0||b< 一 0) 
throw new IllegalArgumentException ("All parameters must be>0"); 
else return (a 十 b 十 Math. abs(a—b))/2; 
} 


在 执行 运算 前 , 先 检测 参数 a 和 4, 一 旦 发 现 非 正 参数 ,就 由 throw 语句 引发 一 个 异常 。 
throw 语句 类 似 于 return 语句 ,但 它 描述 方法 的 异常 终止 。 通 常用 try 块 来 定义 异常 处 理 ， 
在 引发 异常 之 前 ,执行 try 块 体 。 在 try 块 体 之 后 ,有 一 个 或 多 个 异常 处 理 。 每 一 个 异常 处 
理由 一 个 catch 请 名 组成。 这 个 语句 指明 和 欲 捕获 的 异常 以 及 出 现 该 异常 时 要 执行 的 代码 
块 。 当 try 引发 了 一 个 已 定义 的 异常 时 ,控制 就 转移 到 相应 的 异常 处 理 中 。 

public static void main(String [] args) 

{ 

try { £0);} 
catch (exception1) 
{ 异常 处 理 ;} 


catch (exception2) 


{ 异常 处 理 ;} 


finally 
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* 
finally 块 ; 
} 
} 


下 面 是 方法 ab 的 异常 处 理 的 例子 。 


public static void main(String [] args) 
{ 
try {System. out. println("ab 一 "十 ab( 一 5, 一 7));} 
catch (JllegalArgumentException e) 
{ 
System. out. println("a 一 "十 (一 5) 十 ” b= 十 (一 7)); 
System. out. println(e)， 
} 
catch (Throwable e) 
{ 
System. out. println(e); 
finally 
{ 
System. out, println(”Thanks’) ; 
} 
} 


5. Java 的 类 

Java 的 类 (class) 体 现 了 抽象 数据 类 型 (ADT) 的 思想 。 

Java 的 类 一 般 由 4 个 部 分 组 成 : 类 名 ; @ 数 据 成 员 ; @ 方 法 ; @ 访 问 修饰 。 

访问 修饰 表明 对 类 成 员 的 访问 级 别 。Java 中 对 类 成 员 的 访问 有 3 种 不 同 的 级 别 : 中公 
有 (public); 加 私有 (private); 四 保护 (protected) 级 别 。 在 public 域 中 声明 的 数据 成 员 和 
方法 可 以 在 程序 的 任何 部 分 访问 ;在 private 和 protected 域 中 声明 的 数据 成 员 和 方法 构成 
类 的 私有 部 分 ,只 能 由 该 类 的 对 象 和 方法 对 它们 进行 访问 。 此 外 ,在 protected 域 中 声明 的 
数据 成 员 和 方法 还 允许 该 类 的 子 类 访问 它们 。 下 面 是 在 Java 中 定义 矩形 类 Rectangle 的 
例子 。 

public class Rectangle 


{ 
public static final int MAX= 2000; 


private int xy,y， //(Cx,y) 是 矩形 左下 角 点 的 坐标 
hywi //h 是 矩形 的 高 ,w 是 矩形 的 宽 


public Rectangle(int xx,int yy,int hh,int ww) ”// 构 造 方法 
{ 
if (hh<0l|lhh>MAX||ww<0|l|ww>MAX) 


throw new IllegalArgumentException ("Illegal values of h or w’); 
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} 


public Rectangle() // 构 造 方法 
{ this(0,0,0,0);} 


public int getHeight() {return h;} // 返 回 和 矩形 的 高 
public int getWidth() {return w;} // 返 回 和 矩形 的 宽 


public static void main(String [] args) 
{ 
Rectangle r=new Rectangle(); 
Rectangle s 一 new Rectangle(1,1,20,20); 
System. out, println("r. h 一 “十 r. getHeight() 十 ” r.w= “十 r. getWidth()); 
System. out, println("s. h 一 "十 s. getHeight() 十 ” s.w= “十 s. getWidth()); 


} 


1) 类 的 对 象 

类 对 象 的 声明 与 创建 方式 类 似 于 变量 的 声明 与 创建 方式 。 对 一 个 对 象 成 员 进 行 访 问 或 
调用 可 用 “。” 运 算 符 来 实现 。 上 面 的 main 代码 段 说 明了 如 何 声明 类 Rectangle 的 对 象 ,以 
及 如 何 调 用 其 方法 。 

2) 构造 方法 

Java 类 的 构造 方法 (constructor) 用 于 初始 化 对 象 的 数据 成 员 。 构 造 方法 名 与 它 所 在 的 
类 名 相同 。 构 造 方法 必须 声明 为 类 的 公有 方法 。 构 造 方法 不 可 有 返回 值 也 不 得 指明 返回 
类 型 。 

3) 静态 类 成 员 

类 成 员 前 的 关键 字 static 表明 该 类 成 员 是 静态 类 成 员 。Java 只 维护 静态 类 成 员 的 一 个 
拷贝 ,而 非 静态 类 成 员 的 每 个 对 象 都 有 一 个 拷贝 。 当 类 数据 成 员 只 需要 1 份 拷 贝 时 ,可 使 用 
静态 类 成 员 来 节省 空间 。Rectangle 类 中 的 数据 成 员 MAX 是 一 个 静态 类 成 员 。 它 前 面 的 
关键 字 final 表示 其 值 2000 不 可 修改 ,因此 它 是 一 个 常数 。 

Rectangle 类 中 主 方法 main 前 的 关键 字 static 表示 该 方法 是 静态 方法 , 它 的 调用 方式 
与 非 静态 方法 的 调用 方式 不 同 。 

非 静态 方法 的 调用 方式 是 : 所 对 象 名 二 . 去 方法 名 (实际 参数 ) 二 。 

静态 方法 的 调用 方式 是 : 方法 名 (实际 参数 ) 。 
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6. 通用 方法 
下 面 的 方法 swap 用 于 交换 一 维 整 型 数组 a 的 位 置 i 和 位 置 7 处 的 值 。 
public static void swap(int [] a, int i, int j) 
{ 
int temp=a[i]; 
a[i]=a[j]; 
a[j]=temp; 


} 
上 述 方法 只 适用 于 整 型 数组 。 为 了 使 该 方法 具有 通用 性 ,修改 如 下 : 


public static void swap(Object [] a, int i, int j) 
{ 
Object temp=a[i]; 
a[i]=a[j]; 
a[j]=temp; 
. 
修改 后 的 方法 适用 于 Object 类 型 及 其 所 有 子 类 ,特别 是 Object 的 包装 类 Integer， 
Float, Double 等 。 
1) Computable 界面 
下 面 的 方法 sum 用 于 计算 一 维 整 型 数组 a 的 前 ”个 元 素 之 和 。 
public static int sum(int [] a, int n) 


{ 


int sum=0; 
for (int i=0;i<n;it++) 
sum 十 =a[ 订 ; 


return sum; 


上 


要 使 该 方法 具有 通用 性 就 不 像 swap 那么 简单 , 它 需 要 用 到 Computable 界面 。 
Java 的 界面 由 关键 字 interface 表示 , 它 由 若干 常数 (static final 数据 成 员 ) 和 若干 方法 
头 (无 执行 代码 ) 组 成 。Computable 界面 定义 如 下 : 


public interface Computable 

{ 
/x* * @return this 十 x */ 
public Object add(Object x); 
/x** @return this — x */ 
public Object subtract(Object x); 
/x* *#* @return this * x */ 
public Object multiply(Object x); 
/x* x* @return this /x */ 
public Object divide(Object x); 
/x** @return mod(this, x) */ 
public Object mod(Object x); 
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/* < @return this 十 一 x */ 
public Object increment(Object x); 
/* * @return this——=x */ 章 
public Object decrement(Object x); 
/x** @return 0 */ 
public Object zero(); 
/x** @return 1 */ 
public Object identity(); 
} 


利用 此 界面 可 使 方法 sum 通用 化 如 下 : 


public static Computable sum(Computable [] a, int n) 
{ 
if (a. length==0) return null; 
Computable sum= (Computable) a[0]. zero(); 
for (int i=0;i<n;it+) 
sum. increment(a[i]); 
return sum; 


} 

2) java. lang. Comparable 界面 

Java 的 Comparable 界面 中 唯一 的 方法 头 compareTo 用 于 比较 两 个 元 素 的 大 小 。 例 
如 ,java. lang. Comparable. z. compareTo(y) 返 回 z 一 y 的 符号 , 当 z 二 y 时 返回 负数 ; 当 z= 
y 时 返回 0; 当 zx 记 y 时 返回 正 数 。 

3) Operable 界面 

有 些 通用 方法 同时 需要 Computable 界面 和 Comparable 界面 的 支持 。 为 此 可 定义 
Operable 界面 如 下 : 

public interface Operable extends Computable，Comparable 

{} 

Java 中 这 种 没有 常数 ,也 没有 方法 头 的 界面 称 为 标记 界面 。 

4) 自 定义 包装 类 

由 于 Java 的 包装 类 (如 Integer 等 ) 已 经 定义 为 final 型 ,因此 无 法 再 定义 其 子 类 作 进 一 
步 扩充 。 为 了 需要 ,可 以 自 定义 包装 类 。 例 如 , 自 定义 包装 类 MyInteger 如 下 : 

public class MyInteger implements Operable 

. 

// 整 数值 


Private int value; 


// 构 造 方法 
public MyInteger(int v) 


{value=v;} 


//Computable 界面 方法 
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/* * @return this 十 x */ 
public Object add(Object x) 
{ 
return new MylInteger (value 十 ((MyJInteger) x). value); 


} 


//Comparable 界面 方法 
public int compareTo(Object x) 
{ 
int y= ((MylInteger) x). value; 
if (value<y) return —1; 
if (value==y) return 0; 
return 1; 
} 
7. 垃圾 收集 
Java 的 new 运算 用 于 分 配 所 需要 的 内 存 空间 。 例 如 ,int [] a 二 new int[500000]; 请 句 
分 配 2 000 000 字 节 空间 给 整 型 数组 a。 频繁 用 new 分 配 空间 可 能 会 耗 尽 内 存 。Java 的 垃 
圾 收集 器 会 适时 扫描 内 存 ,回收 不 用 的 空间 (垃圾 ) 给 new 重新 分 配 。 垃 圾 收集 器 在 扫描 内 
存 时 ,以 内 存 块 是 否 被 程序 引用 作为 垃圾 判断 条 件 。 例 如 ,在 程序 中 不 再 用 数组 a 时 ,可 用 
语句 4 二 null; 撤 销 程序 对 分 配给 a 的 内 存 块 的 引用 ,使 其 成 为 垃圾 ,让 Java 的 垃圾 收集 器 
回收 后 重新 利用 。 
8. 递归 
Java 允许 方法 调用 其 自身 。 这 类 方法 称 为 递归 方法 。 像 数学 归纳 法 一 样 ,递归 方法 需 
要 进行 基础 测试 。 
计算 一 维 整 型 数组 a 的 前 n 个 元 素 之 和 的 方法 sum, 可 用 递归 方法 表示 如 下 : 
public static int sum(int [] a, int n) 
{ 
让 (n==0) return 0; 


else return a[n—1]+sum(a,n—1); 


1.4 算法 复杂 性 分 析 


算法 复杂 性 的 高 低 体 现在 运行 该 算法 所 需要 的 计算 机 资源 的 多 少 上 ,所 需要 的 资源 越 
多 ,该 算法 的 复杂 性 越 高 ;反之 ,所 需要 的 资源 越 少 ,该 算法 的 复杂 性 越 低 。 计 算 机 的 资源 ， 
最 重要 的 是 时 间 和 空间 ( 即 存储 器 ) 资 源 。 因 此 ,算法 的 复杂 性 有 时 间 复 杂 性 和 空间 复杂 性 
之 分 。 不 言 而 喻 ,对 于 任意 给 定 的 问题 ,设计 出 复杂 性 尽 可 能 低 的 算法 ,是 在 设计 算法 时 追 
求 的 重要 目标 。 另 一 方面 , 当 给 定 的 问题 已 有 多 种 算法 时 ,选择 其 中 复杂 性 最 低 者 ,是 在 选 
用 算法 时 遵循 的 重要 准则 。 因 此 ,算法 的 复杂 性 分 析 对 算法 的 设计 或 选用 有 重要 的 指导 意 
义 和 实 用 价值 。 更 确切 地 说 ,算法 的 复杂 性 是 算法 运行 所 需要 的 计算 机 资源 的 量 ,需要 时 间 
资源 的 量 称 为 时 间 复 杂 性 ,需要 的 空间 资源 的 量 称 为 空间 复杂 性 。 这 个 量 应 该 集中 反映 算 
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法 的 效率 ,而 从 运行 该 算法 的 实际 计算 机 中 抽象 出 来 。 换 句 话 说 ,这 个 量 应 该 只 依赖 于 算法 
要 解 的 问题 的 规模 、 算 法 的 输入 和 算法 本 身 的 函数 。 如 果 分 别 用 N,I 和 A 表示 算法 要 解 的 
问题 的 规模 、 算 法 的 输入 和 算法 本 身 ,而 且 用 C 表示 复杂 性 ,那么 ,应 该 有 C=FCN,T,A)。 
其 中 ,F(N,1,A) 是 N,I 和 A 的 确定 的 三 元 函数 。 如 果 把 时 间 复 杂 性 和 空间 复杂 性 分 开 ， 
并 分 别 用 工 和 S 来 表示 ,那么 应 该 有 : T=T(N,I,A) 和 S=SCN,TI,A)。 通 常 ,让 A 隐 含 
在 复杂 性 函数 名 当中 ,因而 将 工 和 3S 分 别 简写 为 了 =TCN,D 和 S=SCN,D)。 

由 于 时 间 复 杂 性 与 空间 复杂 性 概念 类 同 ,计量 方法 相似 , 且 空 间 复杂 性 分 析 相 对 简单 ， 
所 以 本 书 将 主要 讨论 时 间 复 杂 性 。 现 在 的 问题 是 如 何 将 复杂 性 函数 具体 化 , 即 对 于 给 定 的 
N,T 和 A, 如 何 导出 TCN, 了 和 SCN, 了 TD) 的 数学 表达 式 , 来 给 出 计算 TCN, 了 和 SC(N, 了 的 法 
则 。 下 面 以 TCN ,了 为 例 , 将 复杂 性 函数 具体 化 。 

根据 TC(N ,7 了) 的 概念 , 它 应 该 是 算法 在 一 台 抽 象 的 计算 机 上 运行 所 需要 的 时 间 。 设 此 
抽象 的 计算 机 所 提供 的 元 运算 有 种 ,它们 分 别 记 为 O01 ,0O;,…,O;。 又 设 每 执行 一 次 这 些 
元 运算 所 需要 的 时 间 分 别 为 ,ts,… ,ts。 对 于 给 定 的 算法 A, 设 经 统计 用 到 元 运算 O; 的 次 
数 为 ei,i 二 1,2,…,k。 很 清楚 ,对 于 每 一 个 i,1 二 i<k,e; 是 N 和 了 的 函数 , 即 e;==e;(N,1)。 


因此 , TCN,D = 六 CN,D 。 其 中 心 (i = 1,2,…,k) 是 与 N 和 了 无 关 的 常数 。 


显然 ， 不 可 能 对 规模 N 的 每 一 种 合法 的 输入 工 都 去 统计 e;CN,D ,i 二 1,2,…,k。 因 此 ， 
T(N, 了 ) 的 表达 式 还 须 进一步 简化 。 或 者 说 ,只 能 在 规模 为 N 的 某 些 或 某 类 有 代表 性 的 合 
法 输入 中 统计 相应 的 ci 一 1,2,…,, 以 及 评价 时 间 复 杂 性 。 

本 书 只 考虑 3 种 情况 下 的 时 间 复 杂 性 , 即 最 坏 情 况 、 人 
性 ,并 分 别 记 为 To CN)、Twn CN) 和 TasCN)。 在 数学 上 


天 
TusCN) =maxT (N,D = max 2)tiei(N,D = 0 = TN 
TIEDN JEDN i=1 i=1 
大 大 . S 
Twn(N) 一 RinTCN'D = min 2 te ND 一 Ze ND = TN,D 


TN) = DIP(D TONSD = Brn Yee (N,D 


IEDN TIEDN 

其 中 ,Dw 是 规模 为 N 的 合法 输入 的 集合 ;1* 是 Dw 中 使 TCN,I" ) 达 到 TsCN) 的 合法 输 
入 ;I 是 Dw 中 使 TCN, 了 达到 Tw,(N) 的 合法 输入 ;而 P( 了 DD) 是 在 算法 的 应 用 中 出 现 输入 I 
的 概率 。 

以 上 3 种 情况 下 的 时 间 复 杂 性 各 从 某 一 个 角度 反映 算法 的 效率 ,各 有 各 的 局 限 性 ,也 各 
有 各 的 用 处 。 实 践 表 明 ,可 操作 人 性 最 好 且 最 有 实际 价值 的 是 最 坏 情 况 下 的 时 间 复 杂 性 

随 着 经 济 的 发 展 .社会 的 进步 ,科学 研究 的 深入 ,要 求 用 计算 机 解决 的 问题 越 来 越 复杂 ， 
规模 也 越 来 越 大 。 对 求解 这 类 问题 的 算法 进行 复杂 性 分 析 具 有 重要 意义 ,因而 要 特别 关注 。 
为 此 ,要 引入 复杂 性 渐 近 性 态 的 概念 。 设 T(N) 是 前 面 所 定义 的 关于 算法 A 的 复杂 性 函数 。 
一 般 说 来 , 当 N 单调 增加 且 趋 于 = 时 ,.TCN) 也 将 单调 增加 趋 于 ==。 对 于 T(N), 如 果 存 在 
TT(N) ,使 得 当 N->cc 时 有 (CTCN) 一 荆 ON))/TCN) 一 0, 那 么 ,就 说 CON) 是 TCN) 当 N-co 
时 的 渐 近 性 态 ,或 称 了 (N) 为 算法 A 当 N 一 号 的 渐 近 复杂 性 而 与 T(N) 相 区 别 。 因 为 在 数 
学 上 ,T(N) 是 TCON) 当 N-~~c=c 时 的 渐 近 表达 式 。 直 观 上 ,TCN) 是 TCN) 中 略 去 低 阶 项 所 留 
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下 的 主 项 ,所 以 它 确 实 比 T(N) 和 简单。 例如 , 当 T(N)==3N? 十 4NlogN 十 7 时 0,T(N) 的 一 个 
答案 是 3N? ,因为 这 时 有 


CTOND — TN/ TCNY = MoeN +7 


3N 十 4NlogN 十 7 
显然 ,3N? 比 3N? 十 4NlogN 十 7 简单 得 多 。 

由 于 当 N 习 co 时 TCN) 渐 近 于 TCN), 有 理由 用 TCN) 来 替代 TCN) 作 为 算法 A 在 N 一 
oo 时 的 复杂 性 的 度量 。 而 且 由 于 T(N) 明 显 地 比 TCN) 简 单 ,这 种 替代 明显 地 是 对 复杂 性 
分 析 的 一 种 简化 。 进 一 步 , 考 虑 到 分 析 算 法 的 复杂 性 的 目的 在 于 比较 求解 同一 问题 的 两 个 
不 同 算法 的 效率 。 而 当 要 比较 的 两 个 算法 的 渐 近 复杂 性 的 阶 不 相同 时 ,只 要 能 确定 出 各 自 
的 阶 , 就 可 以 判定 哪 一 个 算法 的 效率 高 。 换 句 话说 ,这 时 的 渐 近 复杂 性 分 析 只 要 关心 TCN) 
的 阶 就 够 了 ,不 必 关 心包 含 在 了 (CN) 中 的 常数 因子 。 所 以 ,常常 又 对 TCN) 的 分 析 进 一 步 简 
化 , 即 假设 算法 中 用 到 的 所 有 不 同 的 元 运算 各 执行 一 次 所 需要 的 时 间 都 是 一 个 单位 时 间 。 

上 面 给 出 了 简化 算法 复杂 性 分 析 的 方法 和 步骤 , 即 只 要 考查 当 问题 的 规模 充分 大 时 , 算 
法 复杂 性 在 渐 近 意义 下 的 阶 。 与 此 简化 的 复杂 性 分 析 相 配套 ,需要 引入 以 下 渐 近 意义 下 的 
记号 : 0,2,0 和 o。 

以 下 设 f(N) 和 g(N) 是 定义 在 正 数 集 上 的 正 函数 。 

如 果 存 在 正 的 常数 C 和 自然 数 No, 使 得 当 N 三 No。 时 有 fC(N) 三 Cg (N), 则 称 函数 
了 (N) 当 N 充分 大 时 上 有 界 , 且 g(N) 是 它 的 一 个 上 界 , 记 为 1(N)= 二 Ol(g(N))。 这 时 还 说 
了 CN) 的 阶 不 高 于 gCN) 的 阶 。 

举例 如 下 : 

(1) 因为 对 所 有 的 N 宇 1 时 有 3N4N, 有 3N=O(N)。 

(2) 因为 当 N 宇 1 时 有 N 十 1024 委 1025N, 有 N 十 1024 二 OCN)。 

(3) 因为 当 N 宇 10 时 有 2N? 十 11N 一 10<3N?, 有 2N? 十 11N 一 10 = OCN?)。 

(4) 因为 对 所 有 N 之 1 时 有 N 委 Ni ,有 六 一 OON3) 。 

(5) 作为 一 个 反例 ,N 和 天 OCN2 ) 。 因 为 若 不 然 , 则 存在 正 的 常数 C 和 自然 数 No ,使 得 当 
N 三 No 时 有 Ni 和 CN: , 即 NC。 显然 , 当 取 N= 二 max{No ,LC | 十 1} 时 这 个 不 等 式 不 成 立 ， 
所 以 N? 关 OCN?)。 

按照 符号 O 的 定义 ,容易 证 明 它 有 如 下 运算 规则 : 

(1) O(f)+O(g)=O(max(f,g)), 

(2) O(N)+O(g)=O0(f+g). 

(3) OC(f)OC(g)=0(fg)., 

(4) 如 果 gC(N)==OCfCN)), 则 OC 二 0(g)=0( 了 有 )。 

(5) OCCFCN))=OCFCN)) ,其 中 C 是 一 个 正 的 常数 。 

C67 FEOCGP。 

规则 (1) 的 证 明 : 设 FCN)=O(CP) 。 根 据 符号 O 的 定义 ,存在 正常 数 C! 和 自然 数 Ni ， 
使 得 对 所 有 的 N 宇 Ni, 有 FCN) 三 Cf(N)。 类 似 地 , 设 G(N) 二 OC(g), 则 存在 正 的 常数 C? 
和 自然 数 N; ,使 得 对 所 有 的 N 宇 N, 有 GCN) 志 Csg(N)。 


一 0 当 N 一 co 时 


@ 本 书 除 特殊 说 明 外 ,log 表示 的 是 以 2 为 底 的 对 数 。 
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令 Cs; 二 max{C1 ,Cs) ,Ns 一 max{NNi,Ns).h(N) 二 max{f,g), 则 对 所 有 的 N 宇 N;, 有 
F(N) < Cf(N) < ChN) < CAON) 
类 似 地 ,有 
G(N) < Cf ON) < Ch(N) < CAN) 
因而 
OC(f) +Ol(g)= F(N) 十 GON) < Csh(N) + Ch(N) 
= 2Csh(N) = O(h) = O(max(f,g)) 

其 余 规 则 的 证 明 类 似 , 可 作为 读者 的 练习 。 

应 该 指出 ,根据 符号 O 的 定义 ,用 它 评 估算 法 的 复杂 性 ,得 到 的 只 是 当 规 模 充分 大 时 的 
一 个 上 界 。 这 个 上 界 的 阶 越 低 则 评估 就 越 精确 ,结果 就 越 有 价值 。 

关于 符号 0Q, 文 献 里 有 两 种 不 同 的 定义 。 本 书 只 采用 其 中 的 一 种 ,定义 如 下 : 如 果 存 在 
正 的 常数 C 和 自然 数 Nu ,使 得 当 N 三 N。 时 ,有 fC(N) 宇 Cg (NN), 则 称 函数 f(N) 当 NN 充分 
大 时 下 有 界 ; 且 gCN) 是 它 的 一 个 下 界 , 记 为 f(N) 二 QC(g(N))。 这 时 还 说 ACN) 的 阶 不 低 于 
gCN) 的 阶 。2 的 这 个 定义 的 优点 是 与 O 的 定义 对 称 ,缺点 是 当 A(N) 对 自然 数 的 不 同 无 穷 
子 集 有 不 同 的 表达 式 , 且 有 不 同 的 阶 时 ,未 能 很 好 地 刻画 出 FCN) 的 下 界 。 例 如 , 当 
100 NN 为 正 偶数 
6N: NN 为 正 奇数 
时 ,如 果 按 上 述 定义 ,只 能 得 到 f(N) 二 Q(1) ,这 是 一 个 平凡 的 下 界 ,对 算法 分 析 没 有 什么 价 
值 。 然 而 ,考虑 到 上 述 定义 与 符号 O 定义 的 对 称 性 ,又 考虑 到 本 书 介 绍 的 算法 都 没 出 现 上 
例 中 的 情况 ,所 以 本 书 还 是 选用 它 。 

同样 要 指出 ,用 Q 评估 算法 的 复杂 性 ,得 到 的 只 是 该 复杂 性 的 一 个 下 界 。 这 个 下 界 的 
阶 越 高 , 则 评估 就 越 精确 ,结果 就 越 有 价值 。 这 里 的 2 只 对 问题 的 一 个 算法 而 言 。 如 果 它 
是 对 一 个 问题 的 所 有 算法 或 某 类 算法 而 言 , 即 对 于 一 个 问题 和 任意 给 定 的 充分 大 的 规模 
NN ,下 界 在 该 问题 的 所 有 算法 或 某 类 算法 的 复杂 性 中 取 , 那 么 它 将 更 有 意义 。 这 时 得 到 的 相 
应 下 界 , 称 为 问题 的 下 界 或 某 类 算法 的 下 界 。 它 常常 与 符号 O 配合 以 证 明 某 问题 的 一 个 特 
定 算法 是 该 问题 的 最 优 算 法 或 该 问题 的 某 算法 类 中 的 最 优 算法 。 

明白 了 符号 O 和 0Q 后 ,符号 9 也 随 之 清楚 ,因为 定义 FCN)=0(CgCN)) 当 且 仅 当 
f(N)==OC(g(N)) 且 f(N) 一 QC(g(N))。 这 时 称 fCN) 与 gC(N) 同 阶 。 

最 后 ,如 果 对 于 任意 给 定 的 s 之 0, 都 存在 正 整 数 N。, 使 得 当 N 之 Ne 时 有 fC(N)/ 
g8(N)e, 则 称 函 数 FCN) 当 N 充分 大 时 的 阶 比 gC(N) 低 , 记 为 f(N)==o(g(N))。 

例如 ,4NlogN 十 7==o(3N? 十 4NlogN 十 7)。 

本 书 中 出 现 的 对 数 函 数 logn 均 以 2 为 底 。 在 算法 领域 通常 将 logzn 简 记 为 logn。 


f(N) = 


小 结 


本 童 介绍 了 算法 的 基本 概念 、 表 达 算 法 的 抽象 机 制 以 及 采用 Java 语言 与 自然 语言 相 结 
合 的 方式 描述 算法 的 方法 ,接着 对 算法 的 计算 复杂 性 分 析 方法 做 了 简要 的 阐述 。 本 章 内 容 
是 后 续 各 章 叙 述 设计 算法 时 常用 的 基本 设计 策略 的 基础 和 准备 。 
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习 题 


说 明 下 面 的 方法 swap 为 什么 无 法 交换 实际 参数 的 值 。 


public static void swap(int x, int y) 
{ 

int temp= x; 

Wy 

y= temp; 


由 


说 明 下 面 的 两 个 方法 头 是 否 有 不 同 的 签名 ,为 什么 ? 

(1) public int fffCint i,int j，int k) 

(2) public float fffCint i,int j, int k) 

写 一 个 通用 方法 用 于 判定 给 定数 组 是 否 已 排 好 序 。 

求 下 列 函数 的 渐 近 表达 式 。 

(1) 372 十 10m 

(2) n2/10+2" 

(3) 21+1/n 

(4) logm’ 

(5) 10log3” 

说 明 O(1) 和 0O(2) 的 区 别 。 

按照 渐 近 阶 从 低 到 高 的 顺序 排列 以 下 表达 式 : 4mw? ,logn，3”" ,20n,2, ns。 又 n! 应 该 

排 在 哪 一 位 ? 

(1) 假设 某 算法 在 输入 规模 为 时 的 计算 时 间 为 T(n) 二 3X2”"。 在 某 台 计算 机 上 实 
现 并 完成 该 算法 的 时 间 为 1 秒 。 现 有 另 一 台 计 算 机 ,其 运行 速度 为 第 一 台 的 
64 倍 , 那 么 在 这 台新 机 器 上 用 同一 算法 在 1 秒 内 能 解 输入 规模 多 大 的 问题 ? 

(2) 车 上 述 算法 的 计算 时 间 改 进 为 (x) 二 ni? ,其 余 条 件 不 变 , 则 在 新 机 器 上 用 +t 秒 时 
间 能 解 输入 规模 多 大 的 问题 ? 

(3) 若 上 述 算 法 的 计算 时 间 进 一 步 改 进 为 T(z) 二 8, 其 余 条 件 不 变 , 那 么 在 新 机 器 上 
用 1 秒 时 间 能 解 输 入 规模 多 大 的 问题 ? 

硬件 厂商 XYZ 公司 宣称 他 们 最 新 研制 的 微 处 理 器 运行 速度 为 其 竞争 对 手 ABC 公司 

同类 产品 的 100 倍 。 对 于 计算 复杂 性 分 别 为 n,n ,mw 和 nl! 的 各 算法 , 若 用 ABC 公司 

的 计算 机 在 1 小 时 内 能 解 输入 规模 为 n 的 问题 ,那么 用 XYZ 公司 的 计算 机 在 1 小 时 

内 分 别 能 解 输入 规模 为 多 大 的 问题 ? 

对 于 下 列 各 组 函数 f(n) 和 g(n), 确 定 f(n) 二 Ol(g(n)) 或 f(n)= 二 QQ(g(n)) 

或 f(n) 二 0(g(n)), 并 简 述 理由 。 

(1) f(n)=logn:, g(n)=logn+t+5 

(2) f (1) =logn’, g(n)=Vn 

(3) f0) =n, g(n)=logn 
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(4) f(n)=nlogntn, g(n)=logn 
(5) f(n)=10, g(n)=logl10 
章 


(6) fn)=log’n, g(n)=logn 
(7) f(n)=2", g(n)=100n 
(8) f(n)=2", g(n)=3" 
1-10 证 明 : n! 二 o(n")。 
1-11 证 明 : 如 果 一 个 算法 在 平均 情况 下 的 计算 时 间 复 杂 性 为 0(f(n)), 则 该 算法 在 最 坏 
情况 下 所 需 的 计算 时 间 为 QC(f(n))。 


二 
递归 与 分 治 策略 


任何 可 以 用 计算 机 求解 的 问题 所 需 的 计算 时 间 都 与 其 规模 有 关 。 问 题 的 规模 越 小 , 解 
题 所 需 的 计算 时 间 往 往 也 越 少 ,从 而 也 较 容易 处 理 。 例 如 ,对 于 个 元 素 的 排序 问题 , 当 
7 一 1 时 ,不 需 任何 计算 ;2 一 2 时 ,只 要 做 一 次 比较 即 可 排 好 序 ;n 二 3 时 只 要 进行 两 次 比较 即 
可 …… 而 当 半 较 大 时 ,问题 就 不 那么 容易 处 理 了 。 要 想 直接 解决 一 个 较 大 的 问题 ,有 时 是 相 
当 困难 的 。 分 治 法 的 设计 思想 是 ,将 一 个 难以 直接 解决 的 大 问题 ,分割 成 一 些 规模 较 小 的 相 
同 问 题 ,以 便 各 个 击破 ,分 而 治之 。 如 果 原 问题 可 分 割 成 个 子 问 题 ,1<k<n, 且 这 些 子 问 
题 都 可 解 ,并 可 利用 这 些 子 问题 的 解 求 出 原 问题 的 解 ,那么 这 种 分 治 法 就 是 可 行 的 。 由 分 治 
法 产生 的 子 问题 往往 是 原 问 题 的 较 小 模式 ,这 就 为 使 用 递归 技术 提供 了 方便 。 在 这 种 情况 
下 ,反复 应 用 分 治 手段 ,可 以 使 子 问题 与 原 问 题 类 型 一 致 而 其 规模 却 不 断 缩 小 ,最 终 使 子 问 
题 缩小 到 很 容易 求 出 其 解 。 由 此 自然 导致 递归 算法 。 分 治 与 递归 像 一 对 挛 生 兄弟 ,经 常 同 
时 应 用 在 算法 设计 之 中 ,并 由 此 产生 许多 高 效 算法 。 


2.1 递归 的 概念 


直接 或 间接 地 调用 自身 的 算法 称 为 递归 算法 。 用 函数 自身 给 出 定义 的 函数 称 为 递归 函 
数 。 在 计算 机 算法 设计 与 分 析 中 ,递归 技术 是 十 分 有 用 的 。 使 用 递归 技术 往往 使 函数 的 定 
义 和 算 法 的 描述 简洁 且 易 于 理解 。 有 些 数据 结构 如 二 又 树 等 ,由 于 其 本 身 固 有 的 递归 特性 ， 
特别 适合 用 递归 的 形式 来 描述 。 另 外 ,还 有 一 些 问 题 ,虽然 其 本 身 并 没有 明显 的 递归 结构 ， 
但 用 递归 技术 来 求解 使 设计 出 的 算法 简洁 易 懂 且 易于 分 析 。 
下 面 举 几 个 实例 。 
例 2.1 阶乘 函数 
阶乘 函数 可 递归 地 定义 为 
天 一 0 
n(n—1)! 7 人 0 
阶乘 函数 的 自 变量 ”的 定义 域 是 非 负 整数 。 递 归 式 的 第 一 趟 给 出 了 这 个 函数 的 初 
始 值 ,是 非 递 归 定 义 的 。 每 个 递归 函数 都 必须 有 非 递 归 定 义 的 初始 值 ,否则 递归 函数 
就 无 法 计算 。 递 归 式 的 第 二 式 是 用 较 小 自 变 量 的 函数 值 来 表达 较 大 自 变量 的 函数 值 
的 方式 来 定义 的 阶乘 。 定义 式 的 左右 两 边 都 引用 了 阶乘 记号 ,是 递归 定义 式 , 可 递 
归 地 计算 如 下 : 


nl 一 
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public static int factorial(int n) 


DD 


让 (n==0) return 1; 
return nx factorial(n—1); 


} 


例 2.2 Fibonacci 数列 
无 穷 数 列 1,1,2,3,5,8,13,21,34,55,…, 称 为 Fibonacci 数列 。 它 可 以 递归 地 定义 为 


Fl(n—1}+F(n—2) 1 之 1 

这 是 一 个 递归 关系 式 , 它 说 明 当 nn 大 于 1 时 ,这 个 数列 的 第 项 的 值 是 它 前 面 两 项 之 
和 。 它 用 两 个 较 小 的 自 变 量 的 函数 值 来 定义 较 大 自 变量 的 函数 值 ,所 以 需要 两 个 初始 值 
F(0) 和 F(1)。 

第 个 Fibonacci 数 可 递归 地 计算 如 下 : 


1 7 一 0,1 
F(n) = | 


public static int fibonacci(int n) 
{ 
if (n<=1) return 1; 
return fibonacci(n—1)+fibonacci(n—2); 


上 述 两 个 例子 中 的 函数 也 可 用 如 下 非 递归 方式 定义 
nl=1X2X3X.…Xx(n—1)xn 


FOn) 点 二 有 f 8)") 


2 2 
例 2.3 Ackerman 函数 
并 非 一 切 递归 函数 都 能 用 非 递 归 方 式 定义 。 为 了 对 递归 函数 的 复杂 性 有 更 多 的 了 解 ， 
再 介绍 一 个 双 递归 函数 一 一 Ackerman 函数 。 当 一 个 函数 以 及 它 的 一 个 变量 是 由 函数 自身 
定义 时 , 称 这 个 函数 是 双 递 归 函 数 。Ackerman 函数 A(n,m) 有 两 个 独立 的 整 变量 m 三 0 和 
7 二 0, 其 定义 为 


A(1,0) 一 2 
A(0,m)=1 m 宇 0 
A(n,0) 一 ?2 十 2 2 之 2 


Al(n,m) = A(A(n—1,m),m— 1) nm 宇 1 
Aln,m) 的 自 变 量 m 的 每 一 个 值 都 定义 了 一 个 单 变量 函数 。 例 如 ,递归 式 的 第 三 式 表 
示 当 m 二 0 时 定义 了 函数 “加 2”。 当 m= 二 1 时 ,由 于 A(1,1)= 一 A(A(0,1),0)=A(1,0)=2 
以 及 A(n,1)= 二 A(A(n 一 1,1),0)= 二 A(n 一 1,1) 十 2 (n 之 1), 因 此 A(n,1)==2n(n 宇 1), 即 
A(z,1) 是 函数 “ 乘 2”。 
当 m= 二 2 时 ,A(n,2)= 二 A(A(n 一 1,2),1)= 一 2A(n 一 1,2) 和 A(1,2)= 一 A(A(0,2),1)== 
A(,1)==2, 故 A(n,2)= 二 2"。 


类 似 地 可 以 推出 ,A Gn,3) 二 22?”, 其 中 2 的 层 数 为 mw。 
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Aln,4) 的 增长 速度 非常 快 ,以 至 于 没有 适当 的 数学 式 子 来 表示 这 一 函数 。 

单 变量 的 Ackerman 函数 A(7) 定 义 为 :A(m) 二 A(n,n)。 其 拟 道 函数 a(n) 在 算法 复杂 性 分 
析 中 常 遇 到 。 它 定义 为 : a(n) 二 min{k|A(k) 宇 n}。 即 (2) 是 使 zx 入 AGO) 成 立 的 最 小 的 & 值 。 

例如 ,由 A(0)=1,A(1)=2, A(2)==4 和 A(3)==16 推 知 ,a(1)==0,a(2)==1， 
a(3) 二 a(4)= 二 2 和 a(5) 二 … 二 a(16) 二 3。 可 以 看 出 a(n) 的 增长 速度 非常 慢 。 


A(4) 一 2*”, 其 中 2 的 层 数 为 65 536, 这 个 数 非常 大 ,无 法 用 通常 的 方式 来 表达 它 。 如 


果 要 写 出 这 个 数 将 需要 log(A(4)) 位 , 即 2”(65 535 层 2 的 方 军 ) 位 。 所 以 ,对 于 通常 所 见 
到 的 正 整 数 n, 有 a(n) 三 4。 但 在 理论 上 a(n) 没 有 上 界 , 随 着 的 增加 , 它 以 难以 想象 的 慢 
速度 趋向 正 无 穷 大 。 

例 2.4 排列 问题 

设 R= {ri,rs，,…,r,} 是 要 进行 排列 的 个 元 素 ,R; 二 R 一 {ri}。 集 合 X 中 元 素 的 全 排列 
记 为 perm(X)。(ri)perm(X) 表 示 在 全 排列 perm(X) 的 每 一 个 排列 前 加 上 前 级 ~ 得 到 的 
排列 。R 的 全 排列 可 归纳 定义 如 下 : 

当 n 二 1 时 ,perm(R) 二 (x) ,其 中 7 是 集合 R 中 唯一 的 元 素 ; 

当 二 1 时 ,perm(R) 由 (ri)perm(R1),(rz)perm(R;s),…,(r,)perm(R,) 构 成 。 

依 此 递归 定义 ,可 设计 产生 perm(R) 的 递归 算法 如 下 : 


public static void perm(Object [] list,int k,int m) 
{// 产 生 list[k:mj 的 所 有 排列 
if (k==m) 
{// 只 剩 一 个 元 素 
for (int i=0;i<=m;i+t 二 ) 
System. out. print(list[i]); 
System. out. println(); 
} 
else 
// 还 有 多 个 元 素 ,递归 产生 排列 
for (int i=k;i<=m;i+t 二 ) 
{ 
MyMath. swap(list,k,i); 
perm(list,k 十 1,m); 
MyMath. swap(list,k,i); 


算法 perm(list,k,m) 递 归 地 产生 所 有 前 级 是 list[0:k 一 1], 且 后 级 是 listL&:z] 的 全 排 
列 的 所 有 排列 。 调 用 算法 perm(list,0,n 一 1) 则 产生 listL0:n 一 1j 的 全 排列 。 

在 一 般 情况 下 ,k 二 m。 算 法 将 list[k:m] 中 每 一 个 元 素 分 别 与 list[k] 中 元 素 交 换 。 然 
后 递归 地 计算 list[k 十 1: mj 的 全 排列 ,并 将 计算 结果 作为 listL0:&j] 的 后 级。 算法 中 
MyMath. swap 用 于 交换 两 个 表 元 素 值 。 

例 2.5 整数 划分 问题 

将 正 整数 n 表示 成 一 系列 正 整 数 之 和 ,n== 吉 十 nz 十 … 十 nn, 其 中 加 宇 ns 三 … 宇 m4 三 1， 
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k>1。 第 
正 整 数 的 这 种 表示 称 为 正 整 数 n 的 划分 。 正 整数 的 不 同 的 划分 个 数 称 为 正 整 数 
的 划分 数 , 记 作 p(n)。 
例如 , 正 整 数 6 有 如 下 11 种 不 同 的 划分 ,所 以 p(6) 二 11。 
6; 
5 十 1; 
4 十 2,4 十 1 十 1; 


3 十 3,3 十 2 十 1,3 十 1 十 1 十 1; 

久生 多 十 22 和 全 二 2 二 直下 L113 

I 大 

在 正 整数 的 所 有 不 同 的 划分 中 ,将 最 大 加 数 不 大 于 mx 的 划分 个 数 记 作 g (n,m)。 
可 以 建立 gtn,m) 的 如 下 递归 关系 。 

(1) qg(Cz,1) 王 1,z 之 1 。 


了 2 
当 最 大 加 数 ni 不 大 于 1 时 ,任何 正 整 数 n 只 有 一 种 划分 形式 , 即 n 二 1 十 1 十 … 十 1。 
(2) gn,sm)=g(n,n) ,mn,。 
最 大 加 数 nn 实际 上 不 能 大 于 n。 因 此 ,g(1,m) 二 1。 
(3) g(n,.n)=1+g(n,n—1),。 
正 整 数 的 划分 由 二 =n 的 划分 和 ni 三 n 一 1 的 划分 组 成 。 
(4) gn.m)=g(nsm—1)+Tgqn—m,m) .n>m>1。 
正 整 数 的 最 大 加 数 n 不 大 于 m 的 划分 由 三 m 的 划分 和 i 三 m 一 1 的 划分 组 成 。 
以 上 的 关系 实际 上 给 出 了 计算 gln,m) 的 递归 式 如 下 : 


1 1 一 1,.72 一 1 
( ) gq(n.n) n=m 
Wo ) = 
l1+g(n,.n—1) n=m 


gnsm— 1)+gq(n—m,m) n>>m1 
据 此 ,可 设计 计算 g(r,m) 的 递归 算法 如 下 。 其 中 , 正 整数 的 划分 数 p(n) 二 gq(n,n)。 


public static int q(int n,int m) 

{ 
让 (Cn<1)|1|(m<1)) return 0; 
让 ((n 一 一 1) | | (m 一 一 1)) return 1; 
if (n<m) return q(n,n); 
if (n==m) return q(n,m—1)+1; 
return qCnym 一 1) 十 qCn 一 mym); 


} 


例 2.6 Hanoi 塔 问题 

设 a,b,c 是 3 个 塔 座 。 开 始 时 ,在 塔 座 a 上 有 一 公共 个 圆 盘 ,这 些 圆 盘 自 下 而 上 ,由 
大 到 小 地 释 在 一 起 。 各 圆 盘 从 小 到 大 编号 为 1,2,…,.n, 如 图 2-1 所 示 。 现 要 求 将 塔 座 a 上 
的 这 一 释 圆 盘 移 到 塔 座 b 上 ,并 仍 按 同样 顺序 又 置 。 在 移动 圆 盘 时 应 该 遵守 以 下 移动 规则 。 
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规则 (1): 每 次 只 能 移动 1 个 圆 盘 。 


a b C 
规则 (2): 任何 时 刻 都 不 允许 将 较 大 的 圆 盘 压 
在 较 小 的 圆 盘 之 上 。 
规则 (3) : 在 满足 移动 规则 (1) 和 规则 (2) 的 前 2 
提 下 ,可 将 圆 盘 移 至 a,b,c 中 任 一 塔 座 上 。 > 


这 个 问题 有 一 个 简单 的 解法 。 假 设 塔 座 a,b,c 
排 成 一 个 三 角形 ,a 一 b>c>a 构成 一 顺 时 针 循环 。 2-1 Hanoi 塔 问题 的 初始 状态 
在 移动 圆 盘 的 过 程 中 ,若是 奇数 次 移动 , 则 将 最 小 
的 圆 盘 移 到 顺 时 针 方 向 的 下 一 塔 座 上 ;若是 偶数 次 移动 , 则 保持 最 小 的 圆 盘 不 动 。 而 在 其 他 
两 个 塔 座 之 间 ,将 较 小 的 圆 盘 移 到 另 一 塔 座 上 去 。 

上 述 算法 简洁 明确 ,可 以 证 明 它 是 正确 的 。 但 只 看 算法 的 计算 步骤 ,很 难 理解 它 的 道 
理 , 也 很 难 理解 它 的 设计 思想 。 下 面 用 递归 技术 来 解决 同一 问题 。 当 = 一 1 时 ,问题 比较 简 
单 , 只 要 将 编号 为 1 的 圆 盘 从 塔 座 a 直接 移 至 塔 座 b 上 即 可 。 当 z>1 时 ,需要 利用 塔 座 c 
作为 辅助 塔 座 。 此 时 若 能 设法 将 ”一 1 个 较 小 的 圆 盘 依照 移动 规则 从 塔 座 a 移 至 塔 座 c, 然 
后 ,将 剩 下 的 最 大 圆 盘 从 塔 座 a 移 至 塔 座 b, 最 后 ,再 设法 将 "一 1 个 较 小 的 圆 盘 依照 移动 规 
则 从 塔 座 e 移 至 塔 座 b。 由 此 可 见 ,个 圆 盘 的 移动 问题 可 分 为 两 次 ?2 一 1 个 圆 盘 的 移动 问 
题 ,这 又 可 以 递归 地 用 上 述 方法 来 做 。 由 此 可 以 设计 出 解 Hanoi 塔 问题 的 递归 算法 如 下 : 


public static void hanoi(int n,int a,int b,int c) 
{ 
if (n>0) 
{ 
hanoi(n—1,a,c,b); 
move(a,b); 
hanoi(n—1,c,b,a); 
} 
; 


其 中 ,hanoi(n,a,b,c) 表 示 将 塔 座 a 上 自 下 而 上 ,由 大 到 小 释 在 一 起 的 个 圆 盘 依 移动 规则 
移 至 塔 座 b 上 并 仍 按 同 样 顺序 释放 。 在 移动 过 程 中 ,以 塔 座 c 作为 辅助 塔 座 。move(a,b) 
表示 将 塔 座 a 上 的 圆 盘 移 至 塔 座 b 上 。 

算法 hanoi 以 递归 形式 给 出 ,每 个 圆 盘 的 具体 移动 方式 不 清楚 ,因此 ,很 难 用 手工 移动 
来 模拟 这 个 算法 。 然 而 ,这 个 算法 易于 理解 ,也 容易 证 明 其 正确 性 ,而 且 易 于 掌握 它 的 设计 
思想 。 由 此 可 见 , 用 递归 技术 来 设计 算法 很 方便 ,而 且 设 计 出 的 算法 往往 比 通常 的 算法 
有 效 。 

像 hanoi 这 样 的 递归 算法 ,在 执行 时 需要 多 次 调用 自身 。 实 现 这 种 递归 调用 的 关键 是 
为 算法 建立 递归 调用 工作 栈 。 通 常 ,在 一 个 算法 中 调用 另 一 算法 时 ,系统 需要 在 运行 被 调用 
算法 之 前 先 完成 以 下 3 件 事 : 

(1) 将 所 有 实 参 指针 ,返回 地 址 等 信息 传递 给 被 调用 算法 。 

(2) 为 被 调用 算法 的 局 部 变量 分 配 存 储 区 。 

(3) 将 控制 转移 到 被 调用 算法 的 入 口 。 
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在 从 被 调用 算法 返回 调用 算法 时 ,系统 也 相应 地 要 完成 以 下 3 件 事 : 

(1) 保存 被 调用 算法 的 计算 结果 。 

(2) 释放 分 配给 被 调用 算法 的 数据 区 。 

(3) 依照 被 调用 算法 保存 的 返回 地 址 将 控制 转移 到 调用 算法 。 

当 有 多 个 算法 构成 嵌 套 调用 时 ,按照 后 调用 先 返 回 的 原则 进行 。 上 述 算法 之 间 的 信息 
传递 和 控制 转移 必须 通过 栈 来 实现 , 即 系统 将 整个 程序 运行 时 所 需 的 数据 空间 安排 在 一 个 
栈 中 ,每 调用 一 个 算法 ,就 为 它 在 栈 项 分 配 一 个 存储 区 ,每 退出 一 个 算法 ,就 释放 它 在 栈 顶 的 
存储 区 。 当 前 正在 运行 的 算法 的 数据 一 定 在 栈 顶 。 

递归 算法 的 实现 类 似 于 多 个 算法 的 能 套 调 用 ,只 是 调用 算法 和 被 调用 算法 是 同一 个 算 
法 。 因 此 ,和 每 次 调用 相关 的 一 个 重要 概念 是 递归 算法 的 调用 层次 。 若 调用 一 个 递归 算法 
的 主 算法 为 第 0 层 算法 , 则 从 主 算法 调用 递归 算法 为 进入 第 1 层 调用 ;从 第 i 层 递 归 调 用 本 
算法 为 进入 第 ;十 1 层 调用 。 反 之 ,退出 第 i 层 递归 调用 , 则 返回 至 第 i 一 1 层 调用 。 为 了 保 
证 递归 调用 正确 执行 ,系统 要 建立 递归 调用 工作 栈 , 为 各 层次 的 调用 分 配 数据 存储 区 。 每 一 
层 递归 调用 所 需 的 信息 构成 一 个 工作 记录 ,其 中 包括 所 有 实 参 指针 .所 有 局 部 变量 以 及 返回 
上 一 层 的 地 址 。 每 进入 一 层 递 归 调 用 ,就 产生 一 个 新 的 工作 记录 压 人 栈 顶 ;每 退出 一 层 递 归 
调用 ,就 从 栈 项 弹出 一 个 工作 记录 。 

图 2-2 是 实现 算法 递归 调用 的 栈 使 用 情况 示意 。 其 中 ,TOP 是 指向 栈 顶 的 指针 。 


主 算法 栈 块 
M 
主 算法 调用 递归 算法 A 的 栈 块 
算法 A 的 第 一 层 递 归 调 用 工作 记录 
算法 A 的 第 二 层 递 归 调用 工作 记录 
TOP 
M 


图 2-2 递归 调用 工作 栈 示意 图 


由 于 递归 算法 结构 清晰 ,可 读 性 强 ,而 且 容 易 用 数学 归纳 法 来 证 明 算 法 的 正确 性 ,因此 
它 为 设计 算法 ,调试 程序 带 来 很 大 方便 。 然 而 ,递归 算法 的 运行 效率 较 低 , 无 论 是 耗费 的 计 
算 时 间 还 是 占用 的 存储 空间 都 比 非 递 归 算 法 要 多 。 若 在 程序 中 消除 算法 的 递归 调用 , 则 其 
运行 时 间 可 大 为 节省 。 因 此 ,有 了 时 希望 在 递归 算法 中 消除 递归 调用 ,使 其 转化 为 非 递归 算 
法 。 通 常 ,消除 递归 采用 一 个 用 户 定义 的 栈 来 模拟 系统 的 递归 调用 工作 栈 , 从 而 达到 将 递归 
算法 改 为 非 递归 算法 的 目的 。 仅 仅 是 机 械 地 模拟 还 不 能 达到 减少 计算 时 间 和 存储 空间 的 目 
的 。 因 此 ,还 需要 根据 具体 程序 的 特点 对 递归 调用 工作 栈 进 行 简 化 ,尽量 减少 栈 操作 ,压缩 
栈 存储 空间 ,以 达到 节省 计算 时 间 和 存储 空间 的 目的 。 


2.2 分 治 法 的 基本 思想 


分 治 法 的 基本 思想 是 将 一 个 规模 为 的 问题 分 解 为 k 个 规模 较 小 的 子 问 题 ,这 些 子 问 
题 互相 独立 且 与 原 问题 相同 。 递 归 地 解 这 些 子 问题 ,然后 将 各 子 问题 的 解 合并 得 到 原 问题 


DD 
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的 解 。 它 的 一 般 的 算法 设计 模式 如 下 : 


divide-and-conquer(P) 
{ 
if (|P|<=n0) adhoc(P); 
divide P into smaller subinstances Pl,P2,** ,Pk; 
for (i=1,i<=k,it+) 
yi= divide-and-conquer(Pi) ; 
return merge(yl,** ,yk); 
} 
其 中 ,|P| 表 示 问 题 P 的 规模 。n0 为 一 阔 值 ,表示 当 问 题 P 的 规模 不 超过 z0 时 ,问题 已 容 
易 解 出 ,不 必 再 继续 分 解 。adhoc(P) 是 该 分 治 法 中 的 基本 子 算法 ,用 于 直接 解 小 规模 的 问 
题 P。 当 PP 的 规模 不 超过 n0 时 ,直接 用 算法 adhoc(P) 求 解 。 算 法 merge(y1,y2,… ,yk) 是 
该 分 治 法 中 的 合并 子 算法 ,用 于 将 P 的 子 问 题 P1,P2,… ,Pk 的 解 y1,y2,… ,yk 合并 为 P 
的 解 。 
根据 分 治 法 的 分 割 原则 ,应 把 原 问题 分 为 多 少 个子 问 题 才 比较 适宜 ? 每 个 子 问题 是 否 
规模 相同 或 怎样 才 为 适当 ? 这 些 问 题 很 难 给 予 肯 定 的 回答 。 但 人 们 从 大 量 实践 中 发 现 ,在 
用 分 治 法 设计 算法 时 ,最 好 使 子 问 题 的 规模 大 致 相同 。 即 将 一 个 问题 分 成 大 小 相等 的 个 
子 问题 的 处 理 方法 是 行 之 有 效 的。 许多 问题 可 以 取 k==2。 这 种 使 子 问 题 规模 大 致 相等 的 
做 法 是 出 自 一 种 平衡 (balancing) 子 问题 的 思想 , 它 几 乎 总 是 比 子 问题 规模 不 等 的 做 法 要 好 。 
从 分 治 法 的 一 般 设计 模式 可 以 看 出 ,用 它 设计 出 的 算法 一 般 是 递归 算法 。 因 此 ,分 治 法 
的 计算 效率 通常 可 以 用 递归 方程 来 进行 分 析 。 一 个 分 治 法 将 规模 为 的 问题 分 成 个 规模 
为 n/m 的 子 问题 去 解 。 为 方便 起 见 , 设 分 解 阔 值 mw 一 1, 且 adhoc 解 规模 为 1 的 问题 耗费 1 
个 单位 时 间 。 另 外 ,再 设 将 原 问题 分 解 为 人 个 子 问 题 以 及 用 merge 将 k 个 子 问题 的 解 合并 
为 原 问题 的 解 需 用 f(x) 个 单位 时 间 。 如 果 用 T(z) 表 示 该 分 治 法 divide-and-conquer(P) 解 
规模 为 | 尸 | 一 的 问题 所 需 的 计算 时 间 , 则 有 
T(n) = O01) 2 一 1 
AT (n/m)+t fn) 7 之 1 
下 面 来 讨论 如 何 解 这 个 与 分 治 法 有 密切 关系 的 递归 方程 。 通 常 可 以 用 展开 递归 式 的 方 
法 来 解 这 类 递归 方程 ,反复 代 和 人 求解 得 


log un-1 
T(n) 一 nt 十 pa kf n/m ) 

注意 ,递归 方程 及 其 解 只 给 出 n 等 于 m 的 方 寒 时 TGQ) 的 值 ,但 是 如 果 T(x) 足 够 平滑 ,由 n 
等 于 m 的 方 短 时 T(7) 的 值 可 以 估计 TGw) 的 增长 速度 。 通 常 ,可 以 假定 Tn) 单 调 上 升 。 

另 一 个 需要 注意 的 问题 是 ,在 分 析 分 治 法 的 计算 效率 时 ,通常 得 到 的 是 如 下 递归 不 等 式 
O(C1) 埃 过 的 
kT (n/m) 十 fn) nno 

在 讨论 最 坏 情 况 下 的 计算 时 间 复 杂 度 时 ,用 等 号 (二) 还 是 用 小 于 或 等 于 号 (三 ) 是 没有 
本 质 区 别 的 。 

以 上 讨论 的 是 分 治 法 的 基本 思想 和 一 般 原则 。 下 面 通过 具体 例子 说 明 如 何 针对 具体 问 


T(n) < | 


递 轨 与 分 治 身 略 


题 用 分 治 思想 来 设计 有 效 算法 。 


2.3 二 分 搜索 技术 


二 分 搜索 算法 是 运用 分 治 策略 的 典型 例子 。 

给 定 已 排 好 序 的 个 元 素 a[0:n 一 1], 现 要 在 这 个 元 素 中 找 出 一 特定 元 素 x 。 

首先 较 易 想到 的 是 用 顺序 搜索 方法 ,逐个 比较 aL0:n 一 1] 中 元 素 , 直 至 找 出 元 素 x 或 搜 
索 遍 整个 数组 后 确定 xz 不 在 其 中 。 这 个 方法 没有 很 好 地 利用 个 元 素 已 排 好 序 这 个 条 件 ， 
因此 在 最 坏 情况 下 ,顺序 搜索 方法 需要 O(n) 次 比较 。 

二 分 搜索 方法 充分 利用 了 元 素 间 的 次 序 关系 ,采用 分 治 策略 ,可 在 最 坏 情况 下 用 
O(logn) 时 间 完 成 搜索 任务 。 

二 分 搜索 算法 的 基本 思想 是 将 个 元 素 分 成 个 数 大 致 相同 的 两 半 , 取 aLn/2] 与 x 进行 
比较 。 如 果 xz 二 a[n/2j, 则 找到 xz, 算 法 终止 。 如 果 zz 过 a[n/2j, 则 只 要 在 数组 a 的 左 半 部 继 
续 搜索 +。 如 果 zx 二 aLn/2j], 则 只 要 在 数组 a 的 右 半 部 继续 搜索 +。 具 体 算法 可 描述 如 下 : 

public static int binarySearch(int [] a,int x,int n) 

{ 

// 在 a[0]<=a[1]<=…<=a[n 一 1] 中 搜索 x 
// 找 到 x 时 返回 其 在 数组 中 的 位 置 , 否 则 返回 一 1 
int left=0;int right 一 n 一 1; 
while (left<= right) 
{ 
int middle= (left+ right)/2; 
if (x==a[middle]) return middle; 
if (x>a[middle]) left=middle+1; 
else right= middle—1; 
} 
return—1; // 未 找到 x 
} 


容易 看 出 ,每 执行 一 次 算法 的 while 循环 , 待 搜索 数组 的 大 小 减少 一 半 。 因 此 ,在 最 坏 
情况 下 ,while 循环 被 执行 了 O(logn) 次 。 循 环 体内 运算 需要 O(1) 时 间 , 因 此 ,整个 算法 在 
最 坏 情况 下 的 计算 时 间 复 杂 性 为 O(logn)。 

二 分 搜索 算法 的 思想 易于 理解 ,但 是 要 写 一 个 正确 的 二 分 搜索 算法 也 不 是 一 件 简单 的 
事 。Knuth 在 他 的 著作 The Art of Computer Programming : Sorting and Searching 中 提 
到 ,第 一 个 二 分 搜索 算法 早 在 1946 年 就 出 现 了 ,但 是 第 一 个 完全 正确 的 二 分 搜索 算法 却 直 
到 1962 年 才 出 现 。 


2.4 大 整数 的 乘法 


通常 ,在 分 析 算 法 的 计算 复杂 性 时 ,都 将 加 法 和 乘法 运算 当 作 基本 运算 来 处 理 , 即 将 执 
行 一 次 加 法 或 乘法 运算 所 需 的 计算 时 间 , 当 作 一 个 仅 取决 于 计算 机 硬件 处 理 速度 的 常数 。 
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这 个 假定 仅 在 参加 运算 的 整数 能 在 计算 机 硬件 对 整数 的 表示 范围 内 直接 处 理 时 才 是 合理 
的 。 然 而 ,在 某 些 情况 下 ,要 处 理 很 大 的 整数 , 它 无 法 在 计算 机 硬件 能 直接 表示 的 整数 范围 
内 进行 处 理 。 若 用 浮 点 数 来 表示 它 , 则 只 能 近似 地 表示 它 的 大 小 ,计算 结果 中 的 有 效 数 字 也 
受到 限制 。 若 要 精确 地 表示 大 整数 并 在 计算 结果 中 要 求 精确 地 得 到 所 有 位 数 上 的 数字 ,就 
必须 用 软件 的 方法 来 实现 大 整数 的 算术 运算 。 

设 X 和 了 都 是 ”位 的 二 进 制 整数 ,现在 要 计算 它们 的 乘积 XY。 可 以 用 小 学 所 学 的 方 
法 来 设计 计算 乘积 XY 的 算法 ,但 是 这 样 做 计算 步骤 太 多 ,效率 较 低 。 如 果 将 每 两 个 1 位 数 
的 乘法 或 加 法 看 作 一 步 运算 ,那么 这 种 方法 要 进行 002 ) 步 运算 才能 算出 乘积 XY。 下 面 用 
分 治 法 来 设计 更 有 效 的 大 整数 乘积 算法 。 

将 位 二 进 制 整 数 X 和 Y 都 分 为 2 段 ,每 段 的 长 为 n/2 位 (为 简单 起 见 , 假 设 n 是 2 的 
客 ) ,如 图 2-3 所 示 。 


12 位 mm2 位 1/2 位 7m2 位 


= 4 B r= C D 


图 2-3 大 整数 X 和 Y 的 分 段 


由 此 ,X=A2” 十 B,Y==C2” 十 D,X 和 YY 的 乘积 为 
XY = (A2w: 十 B)(C2w: + D) = AC2" + (AD 十 CB)2w: + BD 
如 果 按 此 式 计算 XY, 则 必须 进行 4 次 n/2 位 整数 的 乘法 (AC,AD,BC 和 BD), 以 及 3 
次 不 超过 2n 位 的 整数 加 法 (分 别 对 应 于 式 中 的 加 号 ) ,此 外 还 要 进行 2 次 移 位 (分 别 对 应 于 
式 中 乘 2” 和 乘 2”)。 所 有 这 些 加 法 和 移 位 共用 O(n) 步 运算 。 设 T(n) 是 2 个 n 位 整数 相 
乘 所 需 的 运算 总 数 , 则 有 


O(C1) 7 一 1 
4T(n/2) + O(n) n 二 1 

由 此 可 得 T(n) 二 Ow )。 因 此 ,直接 用 此 式 来 计算 X 和 YY 的 乘积 并 不 比 小 学 生 的 方法 
更 有 效 。 要 想 改进 算法 的 计算 复杂 性 ,必须 减少 乘法 次 数 。 下 面 把 XY 写成 另 一 种 形式 

XY = AC2" + ((A—B)(D—C)+AC+BD)2"+BD 

此 式 看 起 来 似乎 更 复杂 些 ,但 它 仅 需 做 3 次 n/2 位 整数 的 乘法 (AC, BD 和 
(4A 一 B)(D 一 C)) ,6 次 加 、 减 法 和 2 次 移 位 。 由 此 可 得 
O01) n= 1 
3T(n/2) + O(n) | 

容易 求 得 其 解 为 了 (n) 二 OCns) 二 O(n"”)。 这 是 一 个 较 大 的 改进 。 

上 述 二 进 制 大 整数 乘法 同样 可 应 用 于 十 进 制 大 整数 的 乘法 以 减少 乘法 次 数 ,提高 算法 
效率 。 如 果 将 大 整数 分 成 3 段 或 4 段 做 乘法 ,计算 复杂 性 会 发 生 什 么 变化 呢 ? 是 否 优 于 分 
成 2 段 来 做 乘法 ? 读者 可 以 通过 有 关 练 习 得 到 明确 的 结论 。 


2.5 Strassen 和 矩阵 乘法 


和 矩阵 乘法 是 线性 代数 中 最 常见 的 问题 之 一 , 它 在 数值 计算 中 有 广泛 的 应 用 .。 设 A 和 B 
是 2 个 nxn 和 矩阵 ,它们 的 乘积 AB 同样 是 一 个 n X7z 和 矩阵 。4 和 B 的 乘积 矩阵 C 中 元 素 


T(n) = | 


T(n) = | 


递 为 与 分 治 策略 


CLij[L;j 定 义 为 CL[ijLi] = DACAIBLAICN]. 


车 依 此 定义 来 计算 A 和 B 的 乘积 矩阵 C , 则 每 计算 C 的 一 个 元 素 C[][ 站 ,需要 做 次 
乘法 运算 入 一 1 次 加 法 运算 。 因 此 ,算出 矩阵 C 的 n? 个 元 素 所 需 的 计算 时 间 为 OG ) 。 
20 世纪 60 年 代 末 期 ,Strassen 采用 了 类 似 于 在 大 整数 乘法 中 用 过 的 分 治 技术 ,将 计算 
2 个 nn 阶 和 矩阵 乘积 所 需 的 计算 时 间 改 进 到 O(n ) 二 O(n*) ,其 基本 思想 还 是 使 用 分 治 法 。 
首先 , 仍 假设 是 2 的 笑 。 将 矩阵 A,B 和 C 中 每 一 矩阵 都 分 块 成 4 个 大 小 相等 的 子 和 矩 
阵 , 每 个 子 矩 阵 都 是 (z/2) X(Cz/2) 的 方 阵 。 由 此 可 将 方程 C 一 4B 重 写 为 
Cu Cr An Arw][Bn Bi 
区 es 本 pls | 
Cn = AnBun 十 AsB2 
C1 = AnB + A Bs 
Ca = Aa By + Azs Bz 
Caz = Az Bis Azs Bs 
如 果 n==2, 则 2 个 2 阶 方 阵 的 乘积 可 以 直接 计算 出 来 , 共 需 8 次 乘法 和 4 次 加 法 。 当 子 
矩阵 的 阶 大 于 2 时 ,为 求 2 个 子 矩 阵 的 积 ,可 以 继续 将 子 窍 阵 分 块 , 直 到 子 矩 阵 的 阶 降 为 2。 
由 此 产生 分 治 降 阶 的 递归 算法 。 依 此 算法 ,计算 2 个 阶 方 阵 的 乘积 转化 为 计算 8 个 n/2 
阶 方 阵 的 乘积 和 4 个 n/2 阶 方 阵 的 加 法 。2 个 Cz/2)X Ca/2) 和 矩阵 的 加 法 显然 可 以 在 OO ) 
时 间 内 完成 。 因 此 ,上 述 分 治 法 的 计算 时 间 耗 费 T(n) 应 满足 
O(1) n=2 


T(z) 一 4 .. 
8T(n/2) 十 OGCz ) > 2 


这 个 递归 方程 的 解 仍然 是 T(n) 二 OC?)。 因 此 ,该 方法 并 不 比 用 原始 定义 直接 计算 更 
有 效 。 究 其 原因 , 乃 是 由 于 该 方法 并 没有 减少 矩阵 的 乘法 次 数 。 而 矩阵 乘法 耗费 的 时 间 要 
比 矩 阵 加 ( 减 ) 法 耗费 的 时 间 多 得 多 。 要 想 改 进 矩 阵 乘法 的 计算 时 间 复 杂 性 ,必须 减少 乘法 
运算 。 
按照 上 述 分 治 法 的 思想 可 以 看 出 ,要 想 减 少 乘法 运算 次 数 ,关键 在 于 计算 2 个 2 阶 方 阵 
的 乘积 时 ,能 否 用 少 于 8 次 乘法 运算 。Strassen 提出 了 一 种 新 的 算法 来 计算 2 个 2 阶 方 阵 
的 乘积 。 他 的 算法 只 用 了 7 次 乘法 运算 ,但 增加 了 加 ,减法 的 运算 次 数 。 这 7 次 乘法 运算 是 
Mi = An (Bi 一 Be) 
Ma = (An 十 Aiz) Ba 
Ms = (4Aa + Azz) Bun 
M, = A (Ba — Bn) 
Ms = (Au + Az) (Bu 十 Bo) 
Ms = (Ais — Azs) (Bz 十 Bo) 
M; = (An — A ) (Bu + Bis) 
做 了 这 7 次 乘法 运算 后 ,再 做 若干 次 加 ,减法 运算 就 可 以 得 到 
Cn = Mi 十 Mi 一 Ms 十 Ms 


由 此 可 得 
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Ca 一 Mi 十 M: 
Ca 一 Ms 十 Ms 
Cs 一 Mi 十 Mi 一 Ms 一 M， 
以 上 计算 的 正确 性 很 容易 验证 。 
Strassen 矩阵 乘法 中 ,用 了 7 次 对 于 2 阶 和 矩阵 乘 的 递归 调用 和 18 次 n/2 阶 和 矩阵 的 加 
减 运算 。 由 此 可 知 ,该 算法 所 需 的 计算 时 间 T(x) 满 足 如 下 的 递归 方程 
TO) = 0O(1) 7 一 2 
7T(n/2) + O(n ) LD 
解 此 递归 方程 得 T(n) 二 O(n ) 守 O(n*)。 由 此 可 见 ,Strassen 矩阵 乘法 的 计算 时 间 
复杂 性 比 普通 矩阵 乘法 有 较 大 改进 。 
有 人 曾 列举 了 计算 2 个 2X2 阶 矩 阵 乘法 的 36 种 不 同方 法 ,但 所 有 的 方法 都 至 少 做 7 
次 乘法 。 除 非 能 找到 一 种 计算 2 阶 方 阵 乘积 的 算法 ,使 乘法 的 计算 次 数 少 于 7 次 ,计算 矩阵 
乘积 的 计算 时 间 下 界 才 有 可 能 低 于 O(n*”)。 但 是 ,Hopcroft 和 Kerr 在 1971 年 已 经 证 明 ， 
计算 2 个 2x2 和 矩阵 的 乘积 ,7 次 乘法 是 必要 的 。 因 此 ,要 想 进 一 步 改进 矩阵 乘法 的 时 间 复 
杂 性 ,就 不 能 再 基于 计算 2X2 矩阵 的 7 次 乘法 这 样 的 方法 了 ,或 许 应 当 研 究 3X3 或 5X5 
矩阵 的 更 好 算法 。 在 Strassen 之 后 又 有 许多 算法 改进 了 和 矩阵 乘法 的 计算 时 间 复 杂 性 。 目 
前 最 好 的 计算 时 间 上 界 是 O(n**)。 而 目前 所 知道 的 矩阵 乘法 的 最 好 下 界 仍 是 它 的 平凡 下 
界 Q(xmw)。 因 此 ,到 目前 为 止 还 无 法 确切 知道 矩阵 乘法 的 时 间 复 杂 性 。 关 于 这 一 研究 课题 
还 有 许多 工作 可 做 。 


2.6 棋盘 覆盖 


在 一 个 2X2* 个 方 格 组 成 的 棋盘 中 , 恰 有 一 个 方 格 与 其 他 方 格 不 同 , 称 该 方 格 为 一 特 
殊 方 格 , 且 称 该 棋盘 为 一 特殊 棋盘 。 显 然 ,特殊 方 格 在 棋盘 上 出 现 辕 


的 位 置 有 4* 种 情形 。 因 而 对 任何 k 宇 0, 有 4 种 不 同 的 特殊 棋盘 。 


图 2-4 中 的 特殊 棋盘 是 当 & 一 2 时 16 个 特殊 棋盘 中 的 一 个 。 
在 棋盘 覆盖 问题 中 ,要 用 图 2-5 所 示 的 4 种 不 同形 态 的 工 型 骨 | 
牌 覆盖 给 定 的 特殊 棋盘 上 除 特殊 方 格 以 外 的 所 有 方 格 , 且 任 何 2 个 | 
L 型 骨牌 不 得 重 释 覆 羔 。 易 知 ,在 任何 一 个 2:X2: 的 棋盘 覆盖 中 ， 
用 到 的 工 型 骨牌 个 数 恰 为 (4 一 1)/3。 国王 4 是 的 一 个 
用 分 治 策略 ,可 以 设计 出 解 棋盘 覆盖 问题 的 简洁 算法 。 物 球 拱 于 


(a) (b) (© (qd) 
图 2-5 4 种 不 同形 态 的 型 骨牌 


当 k 这 0 时 ,将 2 X2: 棋盘 分 割 为 4 个 2"!X2“! 子 棋盘 ,如 图 2-6(a) 所 示 。 
特殊 方 格 必 位 于 4 个 较 小 子 棋盘 之 一 中 ,其 余 3 个 子 棋盘 中 无 特殊 方 格 。 为 了 将 这 3 


递 为 与 分 治 策略 
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2F1 X28 | 2F1X241 


FX IF | 31 x 2F1 


(a) (b) 
2-6 棋盘 分 割 


个 无 特殊 方 格 的 子 棋盘 转化 为 特殊 棋盘 ,可 以 用 一 个 L 型 骨牌 覆盖 这 3 个 较 小 棋盘 的 会 合 
处 ,如 图 2-6(b) 所 示 ,这 3 个 子 棋盘 上 被 L 型 骨牌 覆盖 的 方 格 就 成 为 该 棋盘 上 的 特殊 方 格 ， 
从 而 将 原 问 题 转化 为 4 个 较 小 规模 的 棋盘 覆盖 问题 。 递 归 地 使 用 这 种 分 割 ,直至 棋盘 简化 
为 1X1 棋盘 。 

实现 这 种 分 治 策略 的 算法 chessBoard 可 实现 如 下 : 


public void chessBoard(int tr,int tc,int dr,int dc,int size) 


| 


if (size 一 一 1) return; 
int t 一 tile 十 十 ， //L 型 骨牌 号 
s=size/2; // 分 割 棋盘 
// 覆 盖 左 上 角子 棋盘 
if (dr<tri+s && dc<tc 十 s) 
// 特 殊 方 格 在 此 棋盘 中 


chessBoard(trytcydr,dcys); 

else {// 此 棋盘 中 无 特殊 方 格 
// 用 t+ 号 工 型 骨牌 覆盖 右 下 角 
board[tr 二 s 一 1][tc 十 s 一 1]=t; 
// 覆 盖 其 余 方 格 
chessBoard(trytc'tr 十 s 一 1,tc 十 s 一 1,s);} 


// 覆 盖 右 上 角子 棋盘 

if (dr<tri+s && dc> 一 tc 十 s) 
// 特 殊 方 格 在 此 棋盘 中 
chessBoard(trytc 十 sydr,dc,s); 

else {// 此 棋盘 中 无 特殊 方 格 
// 用 t 号 型 骨牌 覆盖 左下 角 
board[tr+s—1][tc+s]=t; 
// 覆 盖 其 余 方 格 
chessBoard(tr,tc 十 s,tr 十 s 一 1,tc 十 s,s);} 


// 覆 盖 左 下 角子 棋盘 
if (dr>=tri+s && dc<tc 十 s) 
// 特 殊 方 格 在 此 棋盘 中 
chessBoard(tr 十 stc,dr,dc,s); 
else {// 用 + 号 世 型 骨牌 覆盖 右上 角 
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board[tr 十 s][tc 十 s 一 ]] 一 t; 
// 覆 盖 其 余 方 格 
chessBoard(tr 十 sytcytr 十 sytc 十 s 一 1,s);} 


// 覆 盖 右 下 角子 棋盘 

让 (dr> 一 tr 十 s && dc> 一 tc 十 s) 
// 特 殊 方 格 在 此 棋盘 中 
chessBoard(tr 十 sytc 十 sydr,dc,s); 


else {// 用 t 号 L 型 骨牌 覆盖 左上 角 
board[tr+ sj][tc+s]=t; 
// 覆 盖 其 余 方 格 
chessBoard(tr 十 sytc 十 sytr 十 sytc 十 s,s);} 
} 


上 述 算法 中 ,用 整 型 数组 board 表示 棋盘 。boardL0J[L0] 是 棋盘 的 左上 角 方 格 。tile 是 算法 
中 的 一 个 全 局 整 型 变量 ,用 来 表示 L 型 骨牌 的 编号 ,其 初始 值 为 0。 算 法 的 输入 参数 如 下 : 
tr: 棋盘 左上 角 方 格 的 行 号 ; 
tc: 棋盘 左上 角 方 格 的 列 号 ; 
dr: 特殊 方 格 所 在 的 行 号 ; 
dc: 特殊 方 格 所 在 的 列 号 ; 
size: 2 ,棋盘 规格 为 2: X 2*。 
设 T(k) 是 算法 chessBoard 覆盖 一 个 2 X2* 棋盘 所 需 的 时 间 。 从 算法 的 分 割 策略 可 
知 ,，T(&) 满 足 如 下 递归 方程 
有 OD) 项 三 前 
T(k) = 
4T(R 一 1) 十 O(C1) 有 之 0 
解 此 递归 方程 可 得 T(k) = 二 O(4*)。 由 于 覆盖 2: X2* 棋盘 所 需 的 工 型 骨牌 个 数 为 (4* 一 1)/ 
3, 故 算法 chessBoard 是 一 个 在 渐 近 意义 下 最 优 的 算法 。 


2.7 合并 排序 


合并 排序 算法 是 用 分 治 策略 实现 对 个 元 素 进行 排序 的 算法 。 其 基本 思想 是 : 将 待 排 
序 元 素 分 成 大 小 大 致 相同 的 2 个 子 集合 ,分 别 对 2 个 子 集合 进行 排序 ,最 终 将 排 好 序 的 子 集 
合 合并 成 为 所 要 求 的 排 好 序 的 集合 。 合 并 排序 算法 可 递归 地 描述 如 下 : 


public static void mergeSort(Comparable a[ ] ,int left,int right) 
{ 
if (left<right) 
{// 至 少 有 2 个 元 素 
int i= (left+ right) /2; // 取 中 点 
mergeSort(a, left,i); 
mergeSort(a,i 十 1 ,right); 
merge(a,b,left,i, right); // 合 并 到 数组 b 
copy(a,b,left, right); // 复 制 回 数组 a 


递 为 与 分 治 策略 


} 第 
} 4 
其 中 ,算法 merge 合并 2 个 排 好 序 的 数组 段 到 新 的 数组 5 中 ,然后 由 算法 copy 将 合并 后 的 
数组 段 再 复制 回 数组 a 中 。 算 法 merge 和 copy 显然 可 在 O(n) 时 间 内 完成 ,因此 合并 排序 
算法 对 个 元 素 进行 排序 ,在 最 坏 情况 下 所 需 的 计算 时 间 T(n) 满 足 
To = ly nl 


2T(n/2) + O(n) n 二 1 

解 此 递归 方程 可 知 T(n) 二 O(nlogn)。 由 于 排序 问题 的 计算 时 间 下 界 为 Q(nlogn), 故 
合并 排序 算法 是 渐 近 最 优 算法 。 

对 于 算法 mergeSort ,还 可 以 从 多 方面 对 它 进行 改进 。 例 如 ,从 分 治 策略 的 机 制 人 手 ， 
容易 消除 算法 中 的 递归 。 事 实 上 , 算法 mergeSort 的 递归 过 程 只 是 将 待 排序 集合 一 分 为 
二 ,直至 待 排序 集合 只 剩 下 1 个 元 素 为 止 。 然 后 不 断 合并 两 个 排 好 序 的 数组 段 。 按 此 机 制 ， 
可 以 首先 将 数组 a 中 相 邻 元 素 两 两 配对 。 用 合并 算法 将 它们 排序 ,构成 /2 组 长 度 为 2 的 
排 好 序 的 子 数组 段 , 然 后 再 将 它们 排序 成 长 度 为 4 的 排 好 序 的 子 数组 段 , 如 此 继续 下 去 , 直 
至 整个 数组 排 好 序 。 

按 此 思想 ,消去 递归 后 的 合并 排序 算法 可 描述 如 下 : 

public static void mergeSort(Comparable [] a) 

{ 

Comparable [] b=new Comparable [a. length]; 
int s=1; 

while (s<a. length) 

{ 


mergePass(a,b,s); // 合 并 到 数组 b 
s+=s; 
mergePass(b,a,s); // 合 并 到 数组 a 
s+=s; 


} 
} 


其 中 ,算法 mergePass 用 于 合并 排 好 序 的 相 邻 数组 段 。 具 体 的 合并 算法 由 merge 来 实现 。 


public static void mergePass(Comparable [] x,Comparable [] y,int s) 
{ // 合 并 大 小 为 s 的 相 邻 子 数组 
int i 一 0; 
while (i<=x. length 一 2* s) 
{// 合 并 大 小 为 s 的 相 邻 2 段子 数组 
Imerge(xyyyi,i 十 s 一 1,i 十 2x* s 一 1); 
i 一 i 填 2*s; 
} 
// 剩 下 的 元 素 个 数 少 于 2s 
if (i+s=x. length) 
merge(x,y,i,i+s—1,x. length—1); 


else 
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// 复 制 到 y 
for (int j=i;j<x. length;j 十 十 ) 
y[ 订 一 xDj]; 
} 


public static void merge(Comparable [] c,Comparable [] d,int l,int m,int r) 
{// 合 并 c[l:mj 和 cLm 十 1:r] 到 d[1:r] 
int i=1, 
j=m+1， 
k=1; 
while ((i<=m) && (<=7)) 
if (cLi]. compareTo(c[j])<=0) 
d[k+ 二 ] 一 ecLi+ 十 ] 
else d[k 十 十 ]==c[j 十 十 ]; 
if (>m) 
for (int q=j;q<=r;q+ 二 ) 
d[k++jJ=cLq]; 
else 
for (int q=i;d<=m;q 二 十 ) 
d[Lk 十 十 ] 一 c[q]; 
} 
自然 合并 排序 是 上 述 合并 排序 算法 mergeSort 的 变形 。 在 上 述 合并 排序 算法 中 ,第 一 
步 合 并 相 邻 长 度 为 1 的 子 数组 段 ,这 是 因为 长 度 为 1 的 子 数组 段 是 已 排 好 序 的 。 事 实 上 ,对 
于 初始 给 定 的 数组 a, 通常 存在 多 个 长 度 大 于 1 的 已 自然 排 好 序 的 子 数组 段 。 例 如 , 若 数 组 
a 中 元 素 为 {4,8,3,7,1,5,6,2), 则 自然 排 好 序 的 子 数组 段 有 {4,8),{3,7),{1,5,6) 和 (2)。 
用 1 次 对 数组 a 的 线性 扫描 就 足以 找 出 所 有 这 些 排 好 序 的 子 数 组 段 。 然 后 将 相 邻 的 排 好 序 
的 子 数组 段 两 两 合并 ,构成 更 大 的 排 好 序 的 子 数组 段 。 对 上 面 的 例子 ,经 一 次 合并 后 得 到 两 
个 合并 后 的 子 数组 段 13,4,7,8} 和 {1,2,5,6}。 继 续 合 并 相 邻 排 好 序 的 子 数组 段 , 直 至 整个 
数组 已 排 好 序 。 上 面 这 两 个 数组 段 再 合并 后 就 得 到 {1,2,3,4,5,6,7,8}。 
上 述 思想 就 是 自然 合并 排序 算法 的 基本 思想 。 在 通常 情况 下 , 按 此 方式 进行 合并 排序 
所 需 的 合并 次 数 较 少 。 例 如 ,对 于 所 给 的 元 素数 组 已 排 好 序 的 极端 情况 ,自然 合并 排序 算 
法 不 需要 执行 合并 步 ,而 算法 mergeSort 需要 执行 [logn | 次 合并 。 因 此 ,在 这 种 情况 下 , 自 
然 合 并 排序 算法 需要 O(n) 时 间 , 而 算法 mergeSort 需要 O(nlogn) 时 间 。 


2.8 快速 排序 


快速 排序 算法 是 基于 分 治 策略 的 另 一 个 排序 算法 。 其 基本 思想 是 ,对 于 输入 的 子 数组 
a[p:rj, 按 以 下 3 个 步骤 进行 排序 。 

(1) 分 解 (divide): 以 a[p] 为 基准 元 素 将 a[Lp:r] 划 分 成 3 段 a[p:g 一 1],aLgj] 和 
aLg 十 1: 中 ,使 得 aLp:g 一 1j 中 任何 元 素 小 于 等 于 aLgj,aLg 十 1:rj] 中 任何 元 素 大 于 等 于 
aLg]。 下 标 g 在 划分 过 程 中 确定 。 


递 为 与 分 治 策略 


(2) 递归 求解 (conquer) : 通过 递归 调用 快速 排序 算法 ,分 别 对 aLp:g 一 1j 和 aLg 十 1:rj 
进行 排序 。 
(3) 合并 (merge): 由 于 对 ecLp:9q 一 1] 和 ae[o 十 1: 门 的 排序 是 就 地 进行 的 ,所 以 在 
a[p:9 一 1] 和 a[Lg 十 1:r] 都 已 排 好 的 序 后 不 需要 执行 任何 计算 ,aLp:r] 就 已 排 好 序 。 
基于 这 个 思想 ,可 实现 快速 排序 算法 如 下 : 
private static void qSort(int p,int r) 
{ 
if (p<7r) 
{ 
int q 一 partition(p,r); 
qSort (p,q—1); // 对 左 半 段 排序 
qSort (q 十 1,r); // 对 右 半 段 排序 


} 


对 含有 个 元 素 的 数组 a[0:n 一 1] 进 行 快速 排序 只 要 调用 qSort(a,0,n 一 1) 即 可 。 
上 述 算法 中 的 partition, 以 确定 的 基准 元 素 aLpj 对 子 数组 a[p:r J 进行 划分 , 它 是 快速 
排序 算法 的 关键 。 


private static int partition (int p,int r) 
{ 
int i=p, 
j=r+1; 
Comparable x=a[p]; 
// 将 二 x 的 元 素 交换 到 左边 区 域 
// 将 二 x 的 元 素 交换 到 右边 区 域 
while (true) 
{ 
while (a[ ++i]. compareTo(x) <0 && i<r); 
while (a[ 一 一 门 . compareTo(x)>0); 
if (i>=j) break; 
MyMath. swap(a,i,j); 
} 
aLp] 一 a[j]; 
a[j]=x; 
return j; 


} 


算法 partition 对 aLp:rj 进 行 划 分 时 ,以 元 素 x 二 aLpj 作 为 划分 的 基准 ,分 别 从 左 、 右 两 
端 开 始 ,扩展 两 个 区 域 a[p: 让 和 a[j:r], 使 得 a[Lp: 沾 中 元 素 小 于 或 等 于 xz, 而 a[Lj : 门 中 元 素 
大 于 或 等 于 zx。 初始 时 ,i 二 p, 且 j 二 r 十 1。 

在 while 循环 体 中 ,下 标 j 逐渐 减 小 ,i 逐渐 增 大 ,直到 a[ 门 宇 x 宇 a[j]。 如 果 这 两 个 不 
等 式 是 严格 的 , 则 a[ 疏 不 会 是 左边 区 域 的 元 素 .aLj] 不 会 是 右边 区 域 的 元 素 。 此 时 若 <， 
就 应 该 交换 a[ 疏 与 a[ 门 的 位 置 ,扩展 左右 两 个 区 域 。 
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while 循环 重复 至 i 宇 j 时 结束 。 这 时 a[p:rj 已 被 划分 成 a[p:g 一 1],a[gj] 和 
a[Lg 十 1:r], 且 满足 a[p:g 一 1 中 元 素 不 大 于 a[g 十 1:r] 中 元 素 。 在 算法 partition 结束 时 返 
回 划 分 点 g 一 7 。 
事实 上 ,算法 partition 的 主要 功能 就 是 将 小 于 z 的 元 素 放 在 原 数 组 的 左 半 部 分 。 而 将 
大 于 z 的 元 素 放 在 原 数 组 的 右 半 部 分 。 其 中 有 一 些 细节 需要 注意 。 例 如 ,算法 中 的 下 标 i 
和 j 不 会 超出 a[p:rj 的 下 标 界 。 另 外 ,在 快速 排序 算法 中 选取 a[pj 作 为 基准 ,可 以 保证 算 
法 正常 结束 。 如 果 选 择 e[ 门 作为 划分 的 基准 , 且 a[ 门 又 是 ec[Lz: 门 中 的 最 大 元 素 , 则 算法 
partition 返回 的 值 为 g=r, 这 就 会 使 算法 qSort 陷入 死 循 环 。 
对 于 输入 序列 a[p:]j, 算 法 partition 的 计算 时 间 显然 为 OC(r 一 p 一 1)。 
快速 排序 的 运行 时 间 与 划分 是 否 对 称 有 关 , 其 最 坏 情 况 发 生 在 划分 过 程 产生 的 两 个 区 
域 分 别 包含 "一 1 个 元 素 和 1 个 元 素 的 时 候 。 由 于 算法 partition 的 计算 时 间 为 OC0z) ,所 以 
如 果 算 法 partition 的 每 一 步 都 出 现 这 种 不 对 称 划分 , 则 其 计算 时 间 复 杂 性 T(Cz) 满 足 
rw = {7 n1 
T(n—1)+On) | 
解 此 递归 方程 可 得 T(n) 二 O(n ) 。 
在 最 好 情况 下 ,每 次 划分 所 取 的 基准 都 恰好 为 中 值 , 即 每 次 划分 都 产生 两 个 大 小 为 n/2 
的 区 域 , 此 时 ,partition 的 计算 时 间 TO) 满足 
TO = J | 7 和 1 
2T(n/2) + O(n) | 
其 解 为 T(n) 二 O(nlogn)。 
可 以 证 明 ,快速 排序 算法 在 平均 情况 下 的 时 间 复 杂 性 也 是 O(nlogn) ,这 在 基于 比较 的 
排序 算法 类 中 算是 快速 的 了 ,快速 排序 也 因此 而 得 名 。 
快速 排序 算法 的 性 能 取决 于 划分 的 对 称 性 。 通 过 修改 算法 partition, 可 以 设计 出 采用 
随机 选择 策略 的 快速 排序 算法 。 在 快速 排序 算法 的 每 一 步 中 , 当 数 组 还 没有 被 划分 时 ,可 以 
在 a[Lp:rJj 中 随机 选 出 一 个 元 素 作为 划分 基准 ,这 样 可 以 使 划分 基准 的 选择 是 随机 的 ,从 而 
可 以 期 望 划分 是 比较 对 称 的 。 随 机 化 的 划分 算法 可 实现 如 下 : 
Private static int randomizedPartition (int p,int r) 
{ 
int i 一 random(p,r); 
MyMath. swap(ayi,p); 
return partition (p,r); 


} 


其 中 ,random(p,r) 产 生 p 和 7 之 间 的 一 个 随机 整数 ,上 且 产生 不 同 整 数 的 概率 相同 。 
随机 化 的 快速 排序 算法 通过 调用 上 述 算法 randomizedPartition 来 产生 随机 的 划分 。 


Private static void randomizedQuickSort(int p,int r) 
{ 

if (p<7r) 

{ 


int q= randomizedPartition(p,r); 


递 为 与 分 治 策略 


randomizedQuickSort(p,q 一 1);，// 对 左 半 段 排序 
randomizedQuickSort(q 十 1,r); // 对 右 半 段 排序 
} 


2.9 线性 时 间 选 择 


本 节 讨 论 与 排序 问题 类 似 的 元 素 选择 问题 。 元 素 选 择 问 题 的 一 般 提 法 是 :给 定 线性 序 
集中 半 个 元 素 和 一 个 整数 &,1 近 kt 过 7, 要求 找 出 这 交 个 元 素 中 第 & 小 的 元 素 , 即 如 果 将 这 
nn 个 元 素 依 其 线性 序 排列 时 , 排 在 第 k 个 的 元 素 即 为 要 找 的 元 素 。 当 ==1 时 ,就 是 要 找 最 
小 元 素 ; 当 k 二 n 时 ,就 是 要 找 最 大 元 素 ; 当 二 (n 十 1)/2 时 , 称 为 找 中 位 数 。 

在 某 些 特殊 情况 下 ,很 容易 设计 出 解 选择 问题 的 线性 时 间 算 法 。 例 如 , 找 个 元 素 的 最 
小 元 素 和 最 大 元 素 显 然 可 以 在 O(n) 时 间 完 成 。 如 果 三 n/logn, 通 过 堆 排 序 算法 可 以 在 
O(n 十 klogn) 二 On) 时 间 内 找 出 第 小 元 素 。 当 三 n 一 n/logn 时 也 一 样 。 

一 般 的 选择 问题 ,特别 是 中 位 数 的 选择 问题 似乎 比 找 最 小 元 素 要 难 。 但 事实 上 ,从 渐 近 
阶 的 意义 上 看 ,它们 是 一 样 的 。 一 般 的 选择 问题 也 可 以 在 O(n) 时 间 内 得 到 解决 。 下 面 要 讨 
论 解 一 般 的 选择 问题 的 分 治 算法 randomizedSelect。 该 算法 实际 上 是 模仿 快速 排序 算法 设 
计 出 来 的 。 其 基本 思想 也 是 对 输入 数组 进行 递归 划分 。 与 快速 排序 算法 不 同 的 是 , 它 只 对 
划分 出 的 子 数组 之 一 进行 递归 处 理 。 

算法 randomizedSelect 用 到 在 随机 快速 排序 算法 中 讨论 过 的 随机 划分 算法 
randomizedPartition。 因 此 ,划分 是 随机 地 产生 。 由 此 导致 算法 randomizedSelect 也 是 随机 
化 算法 。 要 找 数组 a[0:n 一 1] 中 第 小 元 素 只 要 调用 randomizedSelect(a,0,n 一 1,k) 即 可 。 
具体 算法 可 描述 如 下 

Private static Comparable randomizedSelect(int p,int r,int k) 

{ 

让 (p==r) return a[p]; 
int i 一 randomizedpartition(p,r) ， 
j 一 i 一 p 十 1; 
if (k<=j) return randomizedSelect(p,i,k); 


else return randomizedSelect(i 十 1,r,k 一 j); 


} 


在 算法 randomizedSelect 中 执行 randomizedPartition 后 ,数组 a[p:rj 被 划分 成 两 个 子 
数组 a[p: 让 和 a[i 十 1:], 使 得 a[p: 站 中 每 个 元 素 都 不 大 于 ea[Li 十 1: 门 中 每 个 元 素 。 接 着 算 
法 计算 子 数组 aLp: 辣 中 元 素 个 数 j。 如 果 k<j, 则 aLp:rJ 中 第 & 小 元 素 落 在 子 数组 a[p: 站 
中 。 如 果 二 j, 则 要 找 的 第 小 元 素 落 在 子 数组 a[i 十 1:r] 中 。 由 于 此 时 已 知道 子 数组 
a[z: 甘 中 元 素 均 小 于 要 找 的 第 上 小 元 素 , 因 此 ,要 找 的 [2: 门 中 第 小 元 素 是 a[i 十 1: 门 中 
的 第 & 一 7 小 元 素 。 

可 以 看 出 ,在 最 坏 情况 下 算法 randomizedSelect 需要 Q(xm?) 计 算 时 间 。 例 如 ,在 找 最 小 
元 素 时 ,总 是 在 最 大 元 素 处 划分 。 尽 管 如 此 ,该 算法 的 平均 性 能 很 好 。 

由 于 随机 划分 算法 randomizedPartition 使 用 了 随机 数 产 生 器 random , 它 能 随机 地 产生 
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户 和 7 之 间 的 一 个 随机 整数 ,因此 ,randomizedPartition 产生 的 划分 基准 是 随机 的 。 在 这 个 
条 件 下 ,可 以 证 明 ,算法 randomizedSelect 可 以 在 O(n) 平 均 时 间 内 找 出 个 输入 元 素 中 的 
第 & 小 元 素 。 

下 面 来 讨论 类 似 于 算法 randomizedSelect 但 可 以 在 最 坏 情 况 下 用 O(n) 时 间 就 完成 选 
择 任务 的 算法 select。 如 果 能 在 线性 时 间 内 找到 一 个 划分 基准 ,使 得 按 这 个 基准 所 划分 出 
的 两 个 子 数组 的 长 度 都 至 少 为 原 数组 长 度 的 s 倍 (0 一 es 一 1 是 某 个 正常 数 ) ,那么 就 可 以 在 最 
坏 情况 下 用 O(n) 时 间 完 成 选择 任务 。 例 如 , 若 e 二 9/10, 算 法 递归 调用 所 产生 的 子 数 组 的 长 
度 至 少 缩短 1/10。 所 以 ,在 最 坏 情况 下 ,算法 所 需 的 计算 时 间 T(x) 满 足 递归 式 T(n) 牵 
T(9n/10) 十 O(n)。 由 此 可 得 T(n)= 二 O(n)。 

按 以 下 步骤 可 以 找到 满足 要 求 的 划分 基准 : 

(1) 将 个 输入 元 素 划分 成 [n/5 | 个 组 ,每 组 5 个 元 素 , 只 可 能 有 一 个 组 不 是 5 个 元 素 。 
用 任意 一 种 排序 算法 ,将 每 组 中 的 元 素 排 好 序 ,并 取出 每 组 的 中 位 数 , 共 [ mn/5 1 个 。 

(2) 递归 调用 算法 select 来 找 出 这 [「 5] 个 元 素 的 中 位 数 。 如 果 J「 zx/5 1 是 偶数 ,就 找 它 
的 两 个 中 位 数 中 较 大 的 一 个 。 以 这 个 元 素 作为 划分 基准 。 

图 2-7 是 上 述 划 分 策略 的 示意 图 ,其 中 ,n 个 元 素 用 小 圆 点 来 表示 ,空心 小 圆 点 为 每 组 元 
素 的 中 位 数 。 中 位 数 的 中 位 数 z 在 图 中 标 出 。 图 中 所 画 箭头 是 由 较 大 元 素 指 向 较 小 元 素 。 


图 2-7 选择 划分 基准 


只 要 等 于 基准 的 元 素 不 太 多 ,利用 这 个 基准 划分 的 两 个 子 数 组 的 大 小 就 不 会 相差 太 远 。 
为 了 简化 问题 , 先 设 所 有 元 素 互 不 相同 。 在 这 种 情况 下 , 找 出 的 基准 z 至 少 比 
3L(n 一 5)/10 J 个 元 素 大 ,因为 在 每 一 组 中 有 两 个 元 素 小 于 本 组 的 中 位 数 ,而 Ln/5 J 个 中 位 数 
中 又 有 L(n 一 5)/10 4 个 小 于 基准 zx。 同 理 , 基 准 zx 也 至 少 比 3LCz 一 5)/10 J 个 元 素 小 。 而 当 
n 宇 75 时 ,31(n 一 5)/10」 宇 n/4。 所 以 按 此 基准 划分 所 得 的 两 个 子 数组 的 长 度 都 至 少 缩短 
1/4。 这 一 点 是 至 关 重 要 的 。 据 此 ,可 以 给 出 算法 select 如 下 : 

Private static Comparable select(int p,int r,int k) 

{ 

让 (r—p<5) 

{ // 用 某 个 简单 排序 算法 对 数组 aLp:rj 排 序 ; 
bubbleSort(p,r); 
return a[Lp 十 k 一 1]; 


递 为 与 分 治 策略 


// 将 a[p 十 5* 电 至 a[p 十 5* i 十 4 的 第 3 小 元 素 
// 与 aLp 十 订 交 换 位 置 ; 
// 找 中 位 数 的 中 位 数 ,r 一 p 一 4 即 上 面 所 说 的 n 一 5 


for (int i 一 0;i 一 一 (r 一 p 一 4)/5;i 十 十 ) 
{ 
int s 一 p 十 5#x iy 
8 
for (int j=0;j=<3;j 十 十) bubble(s,t 一 )); 
MyMath. swap(a, p+i,s+2); 
} 
Comparable x 一 select(p,p 十 (r 一 p 一 4)/5,(r 一 p 十 6)/10)， 
int ji 一 partition(p,ryx)， 
j=i 一 p 十 1 
if (k<=j) return select(p,i,k); 
else return select(i 十 1,r,k 一 ))， 


} 


为 了 分 析 算 法 select 的 计算 时 间 复 杂 性 , 设 n=r 一 p 十 1, 即 为 输入 数组 的 长 度 。 算 
法 的 递归 调用 只 有 在 n 三 75 时 才 执 行 。 因 此 , 当 nn 二 75 时 算法 select 所 用 的 计算 时 间 不 超 
过 一 个 常数 Cy 。 找 到 中 位 数 的 中 位 数 工 后 ,算法 select 以 为 划分 基准 调用 partition 对 数 
组 ec[L2: 门 进行 划分 ,这 需要 O(z) 时 间 。 算 法 select 的 for 循环 体 行 共 执行 n/5 次 ,每 一 次 
需要 O(G1) 时 间 。 因 此 ,执行 for 循环 共 需 O(n) 时 间 。 

设 对 个 元 素 的 数组 调用 算法 select 需要 T(Cz) 时 间 ,那么 找 中 位 数 的 中 位 数 xz 至 多 用 
了 TCxyV5) 的 时 间 。 已 经 证 明了 ,按照 算法 所 选 的 基准 z 进行 划分 所 得 到 的 2 个 子 数组 分 别 
至 多 有 3n/4 个 元 素 。 所 以 ,无 论 对 哪 一 个 子 数组 调用 ,select 都 至 多 用 了 TC(3n/4) 的 时 间 。 

总 之 ,可 以 得 到 关于 T(Gz) 的 递归 式 

Ci w= 15 
T(n) < a 
Cnt Tn/5)+ TC(3n/4) nn 之 75 

解 此 递归 式 可 得 T(n) 二 O(n)。 

上 述 算 法 将 每 一 组 的 大 小 定 为 5, 并 选取 75 作为 是 否 作 递归 调用 的 分 界 点 。 这 两 点 保 
证 了 Toz) 的 递归 式 中 2 个 自 变 量 之 和 /5 十 3z/4 一 19z/20 一 am,0<w<<1。 这 是 使 T(z) 一 
O0Co) 的 关键 之 处 。 当 然 ,除了 5 和 75 之 外 ,还 有 其 他 选择 。 

在 算法 select 中 ,假设 所 有 元 素 互 不 相等 ,这 是 为 了 保证 在 以 z 为 划分 基准 调用 
partition 对 数组 ec[z: 门 进行 划分 之 后 ,所 得 到 的 2 个 子 数组 的 长 度 都 不 超过 原 数 组 长 度 的 
3/4。 当 元 素 可 能 相等 时 ,应 在 划分 之 后 加 一 个 语句 ,将 所 有 与 基准 x 相等 的 元 素 集中 在 一 
起 ,如 果 这 种 元 素 的 个 数 mw 三 1, 而 且 j 壹 k 达 j 十 m 一 1 时 ,就 不 必 再 递归 调用 ,只 要 返回 a[ 门 
即 可 。 和 否则 ,最 后 一 行 改 为 调用 select(i 十 mn 十 1 ,r,k 一 j 一 m)。 


2.10 最 接近 点 对 问题 


在 计算 机 应 用 中 ,常用 诸如 点 、 圆 等 简单 的 几何 对 象 表达 现实 世界 中 的 实体 。 在 涉及 这 
些 几何 对 象 的 问题 中 , 常 需要 了 解 其 邻 域 中 其 他 几何 对 象 的 信息 。 例 如 ,在 空中 交通 控制 问 
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题 中 , 若 将 飞机 作为 空间 中 移动 的 一 个 点 来 处 理 , 则 具有 最 大 碰撞 危险 的 两 架 飞 机 就 是 这 个 
空间 中 最 接近 的 一 对 点 。 这 类 问题 是 计算 几何 学 中 研究 的 基本 问题 之 一 。 下 面 着 重 考虑 平 
面 上 的 最 接近 点 对 问题 。 

最 接近 点 对 问题 的 提 法 是 : 给 定 平面 上 个 点 , 找 其 中 的 一 对 点 ,使 得 在 个 点 组 成 的 
所 有 点 对 中 该 点 对 间 的 距离 最 小 。 

严格 地 讲 , 最 接近 点 对 可 能 多 于 1 对 ,为 简单 起 见 , 只 找 其 中 的 1 对 作为 问题 的 解 。 这 
个 问题 很 容易 理解 ,似乎 也 不 难 解决 。 只 要 将 每 一 点 与 其 他 ”一 1 个 点 的 距离 算出 , 找 出 达 
到 最 小 距离 的 2 点 即 可 。 然 而 ,这 样 做 效率 太 低 , 需 要 Ol) 的 计算 时 间 。 可 以 证 明 , 该 问 
题 的 计算 时 间 下 界 为 QC(nlogn)。 这 个 下 界 引 导 去 找 问题 的 9(nlogn) 时 间 算 法 。 很 自然 地 
会 想到 用 分 治 法 来 解 这 个 问题 。 也 就 是 说 ,将 所 给 的 平面 上 个 点 的 集合 S 分 成 2 个 子 集 
S 和 S, ,每 个 子 集 中 约 有 n/2 个 点 。 然 后 在 每 个 子 集 中 递归 地 求 其 最 接近 的 点 对 。 这 里 关 
键 的 问题 是 如 何 实现 分 治 法 中 的 合并 步骤 , 即 由 S, 和 5; 的 最 接近 点 对 ,如 何 求 得 原 集合 S 
中 的 最 接近 点 对 。 如 果 组 成 S 的 最 接近 点 对 的 2 个 点 都 在 S, 中 或 都 在 Ss 中 , 则 问题 很 容 
易 解决 。 但 是 ,如 果 这 2 个 点 分 别 在 S 和 S: 中 ,问题 就 不 那么 简单 了 。 

为 了 使 问题 易于 理解 和 分 析 , 先 来 考虑 一 维 的 情形 。 此 时 ,S 中 的 n 个 点 退化 为 x 轴 上 
的 n 个 实数 x1 ,zx2，… ,zs。 最 接近 点 对 即 为 这 个 实数 中 相差 最 小 的 2 个 实数 。 显 然 可 以 
先 将 zi ,zs，,…,z, 排 好 序 ,然后 用 一 次 线性 扫描 就 可 以 找 出 最 接近 点 对 。 这 种 方法 的 主要 
计算 时 间 花 在 排序 上 ,因此 耗 时 O(nlogn)。 然 而 ,这 种 方法 无 法 直接 推广 到 二 维 的 情形 。 
因此 ,对 一 维 的 简单 情形 ,还 是 尝试 用 分 治 法 来 求解 ,并 希望 推广 到 二 维 的 情形 。 

假设 用 xz 轴 上 某 个 点 m 将 S 划分 为 2 个 集合 S! 和 S; ,使 得 S1={x€SIzx<m});S,= 
{zESlz>>m}。 因 此 ,对 于 所 有 pES 和 gE€S, 有 p=g。 

递归 地 在 S, 和 S。 上 找 出 其 最 接近 点 对 {pi ,ps)} 和 {qi qz) ,并 设 

d= min{| pi—p:|,|q—g|} 

由 此 易 知 ,S 中 的 最 接近 点 对 或 者 是 {pi ,ps}) ,或 者 是 (qi ,qs) ,或 者 是 某 个 (p,q;), 其 

中 ,psESi 且 q ESs, 如 图 2-8 所 示 。 
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图 2-8 一 维 情形 的 分 治 法 


注意 到 ,如 果 S 的 最 接近 点 对 是 {ps.g3): 即 1ps 一 qs | 二 d, 则 p 和 gs 两 者 与 m 的 距离 
不 超过 d , 即 | ps 一 m| 二 d,1g; 一 m| 二 d。 也 就 是 说 ,ps3E lm 一 d ,mj,qs Elm,m 十 d]。 由 于 
每 个 长 度 为 d 的 半 闭 区 间 至 多 包含 Si 中 的 一 个 点 ,并 且 mw 是 Si 和 S; 的 分 割 点 ,因此 Gm 一 
d ,mj 中 至 多 包含 一 个 S 中 的 点 。 同 理 ,(m,m 十 dj 中 也 至 多 包含 一 个 S 中 的 点 。 由 图 2-8 
可 以 看 出 ,如 果 Gm 一 d,mj] 中 有 S 中 点 , 则 此 点 就 是 S; 中 最 大 点 。 同 理 ,如 果 (m,m 十 dj 中 
有 S 中 的 点 , 则 此 点 就 是 S; 中 最 小 点 。 因 此 ,用 线性 时 间 就 能 找到 区 间 (m 一 d ,mj] 和 (rm， 
m 十 dj] 中 所 有 点 , 即 ps 和 gs。 从 而 用 线性 时 间 就 可 以 将 Si 的 解 和 S; 的 解 合 并 成 为 S 的 
解 。 也 就 是 说 , 按 这 种 分 治 策略 ,合并 步 可 在 O(n) 时 间 内 完成 。 这 样 是 否 就 可 以 得 到 一 个 


递 为 与 分 治 策略 


有 效 的 算法 了 呢 ? 还 有 一 个 问题 需要 认真 考虑 , 即 分 割 点 m 的 选取 以 及 S, 和 S: 的 划分 。 
选取 分 割 点 m 的 一 个 基本 要 求 是 由 此 导出 集合 S 的 一 个 线性 分 割 , 即 S=S1US;,S1 关 2， 
S: 天 节 , 且 SIC{zlz 委 om) ,SC{zlz>m}。 容 易 看 出 ,如 果 选 取 关 一 (max(S) 十 min(S))/ 
2, 可 以 满足 线性 分 割 的 要 求 。 选 取 分 割 点 后 ,再 用 OCz) 时 间 即 可 将 S 划分 成 Si 一 (4zES| 
Xm}) 和 Ss 一 {rE SIz 之 m)。 然 而 ,这 样 选取 分 割 点 mx, 有 可 能 造成 划分 出 的 子 集 S 和 S。 
的 不 平衡 。 例 如 ,在 最 坏 情况 下 ,|Si | 二 1,|1S; | 二 n 一 1, 由 此 产生 的 分 治 法 在 最 坏 情 况 下 所 
需 的 计算 时 间 TCz) 应 满足 递归 方程 
T(n) = T(n—1)+O(n) 
上 述 方程 的 解 是 T(n) 二 O(w)。 这 种 效率 降低 的 现象 可 以 通过 分 治 法 中 “平衡 子 问 
题 "的 方法 加 以 解决 。 也 就 是 说 ,可 以 通过 适当 选择 分 割 点 m, 使 S, 和 S, 中 有 个 数 大 致 相 
等 的 点 。 自 然 地 ,会 想到 用 S 中 各 点 坐标 的 中 位 数 来 作 分 割 点 。 用 选取 中 位 数 的 线性 时 间 
算法 可 以 在 O(n) 时 间 内 确定 一 个 平衡 的 分 割 点 m。 
至 此 ,可 以 设计 出 求 一 维 点 集 S 的 最 接近 点 对 的 算法 cpairl 如 下 : 
public static double cpair1(S) 
{ 
n=|S|; 
if (n<2) return cc; 
m 一 S 中 各 点 坐标 的 中 位 数 ; 
构造 SI 和 S2; 
//Sl={x€ES|x<=m)},S2={x€ S|x>m} 
dl=cpairl(S1); 
d2= cpairl (S2); 
p= max(S1); 
q 一 min(S2); 
d 一 min(dl ,d2,q 一 p); 
return d; 


} 

由 以 上 的 分 析 可 知 , 该 算法 的 分 割 步骤 和 合并 步骤 总 共 耗 时 O(n)。 因 此 ,算法 耗费 的 
计算 时 间 02) 满足 递归 方程 
O(C1) n=4 
2T(n/2) + O(n) 和 :六 条 
解 此 递归 方程 可 得 T(x) 二 O(nlogn)。 

这 个 算法 看 上 去 比 用 排序 加 扫描 的 算法 复杂 ,然而 它 可 以 推广 到 二 维 的 情形 。 

下 面 考虑 二 维 的 情形 。 此 时 S 中 的 点 为 平面 上 的 点 ,它们 都 有 两 个 坐标 值 x 和 y。 为 
了 将 平面 上 点 集 S 线性 分 割 为 大 小 大 致 相等 的 两 个 子 集 S，, 和 S; ,选取 一 垂直 线 1:x 二 m 来 
作为 分 割 直线 。 其 中 ,m 为 S 中 各 点 工 坐标 的 中 位 数 。 由 此 将 S 分 割 为 S51={p€ESIz(p) 达 
m} 和 Ss 二 {pESIz(p) 记 m)。 从 而 使 S, 和 S; 分 别 位 于 直线 7 的 左 侧 和 右 侧 , 且 S=S1U 
S。。 由 于 mm 是 S 中 各 点 x 坐标 值 的 中 位 数 ,因此 ,S, 和 Ss 中 的 点 数 大 致 相等 。 

递归 地 在 S 和 S, 上 解 最 接近 点 对 问题 ,分 别 得 到 S, 和 Ss 中 的 最 小 距离 d; 和 4，。 现 
设 d 二 min{di,d,}。 若 S 的 最 接近 点 对 (p,q) 之 间 的 距离 小 于 d, 则 p 和 g 必 分 属于 S, 和 
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S: 。 不 妨 设 bpESi,qES:*。 户 和 9 距 直 线 1 的 距离 均 小 于 4d。 
因此 ,车 用 P, 和 P， 分 别 表示 直线 1 的 左边 和 右边 的 宽 为 d 
的 两 个 垂直 长 条 , 则 p€ P, 有 是 g€ P; ,如 图 2-9 所 示 。 

在 一 维 的 情形 , 距 分 割 点 距离 为 d 的 两 个 区 间 (m 一 d,m) 
和 (m,m 十 d) 中 最 多 各 有 S 中 一 个 点 。 因 而 这 两 个 点 成 为 唯 
一 的 未 检查 过 的 最 接近 点 对 候选 者 。 二 维 的 情形 则 复杂 些 ， 
此 时 ,Pi 中 所 有 点 与 P。 中 所 有 点 构成 的 点 对 均 为 最 接近 点 
对 的 候选 者 。 在 最 坏 情况 下 有 ww/4 对 这 样 的 候选 者 。 但 是 。 图 2-9 距 直 线 1 的 距离 
Pi 和 P 中 的 点 具有 以 下 的 稀 牙 性 质 ,因此 不 必 检 查 所 有 这 小 于 4 的 所 有 点 
72/4 个 候选 者 。 考 虑 P 中 任意 一 点 p, 它 若 与 P 中 的 点 g 
构成 最 接近 点 对 的 候选 者 , 则 必 有 distance(p,q) 二 d。 满 足 这 个 条 件 的 P; 中 的 点 有 多 少 个 
呢 ? 容易 看 出 这 种 点 一 定 落 在 一 个 dX2d 的 矩形 R 中 ,如 图 2-10 所 示 。 

由 4d 的 意义 可 知 ,P, 中 任何 两 个 S 中 的 点 的 距离 都 不 小 于 & 。 由 此 可 以 推出 矩形 R 中 
最 多 只 有 6 个 S 中 的 点 。 事实 上 ,可 以 将 矩形 R 的 长 为 2d 的 边 3 等 分 ,将 它 的 长 为 d 的 边 
2 等 分 ,由 此 导出 6 个 (d/2)X(2cd/3) 的 矩形 ,如 图 2-11(a) 所 示 。 
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图 2-10 包含 点 gq 的 dX24d 和 矩形 R 图 2-11 矩形 R 中 点 的 稀 朴 性 


若 和 矩形 R 中 有 多 于 6 个 S 中 的 点 , 则 由 钥 含 原理 易 知 ,至 少 有 一 个 (d/2)X(2d/3) 的 小 
矩形 中 有 两 个 以 上 S 中 的 点 。 设 u,v 是 位 于 同一 小 矩形 中 的 两 个 点 , 则 


(Cz(O — zDD + yD) 一 ya)2 < 二 (Cd/2)2 十 (2d/3)2 = 全 
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因此 ,distance(u,v) 三 5d/6 二 d, 这 与 d 的 意义 相 矛 盾 。 也 就 是 说 ,和 托 形 R 中 最 多 只 有 
6 个 S 中 的 点 。 图 2-11(b) 是 矩形 尺 中 恰 有 6 个 S 中 点 的 极端 情形 。 由 于 这 种 稀 玻 性 质 ， 
对 于 Pi 中 任 一 点 户 ,P, 中 最 多 只 有 6 个 点 与 它 构成 最 接近 点 对 的 候选 者 。 因 此 ,在 分 治 法 
的 合并 步骤 中 ,最 多 只 需要 检查 6XzV/2 王 372 个 候选 者 ,而 不 是 妈 /4 个 候选 者 。 这 是 否 就 意 
味 着 可 以 在 O(z) 时 间 内 完成 分 治 法 的 合并 步骤 呢 ? 现在 还 不 能 得 出 这 个 结论 。 因 为 只 知 
道 对 于 P, 中 每 个 S, 中 的 点 最 多 只 需要 检查 S, 中 6 个 点 ,但 是 并 不 确切 地 知道 要 检查 哪 6 
个 点 。 为 了 解决 这 个 问题 ,可 以 将 p 和 Ps 中 所 有 S，, 的 点 投影 到 垂直 线 / 上。 由 于 能 与 p 
点 一 起 构成 最 接近 点 对 候选 者 的 Ss 中 点 一 定 在 矩形 R 中 ,所 以 它们 在 直线 1 上 的 投影 点 距 
在 1 上 投影 点 的 距离 小 于 d。 由 上 面 的 分 析 可 知 ,这 种 投影 点 最 多 只 有 6 个 。 因 此 ,车 将 


dad? 


递 为 与 分 治 策略 


P, 和 P, 中 所 有 S 中 点 按 其 y 坐标 排 好 序 , 则 对 Pi 中 所 有 点 ,对 排 好 序 的 点 列 进行 一 次 扫 
描 , 就 可 以 找 出 所 有 最 接近 点 对 的 候选 者 。 对 已 中 每 一 点 最 多 只 要 检查 P 中 排 好 序 的 相 
继 6 个 点 。 

至 此 ,可 以 给 出 用 分 治 法 求 平面 点 集 最 接近 点 对 的 算法 cpair2 如 下 : 


public static double cpair2(S) 
{ 
n=|S|; 
让 (n<2) return oo; 
.m 一 S 中 各 点 x 间 坐标 的 中 位 数 ; 
构造 SI 和 S2; 
//Sl={p€ES|x(p)<=m},S2={pE S|x(p)>m} 
.dl= cpair2(S1); 
d2= cpair2(S2); 
.dm= min(d1,d2); 
. 设 Pl 是 Sl 中 距 垂直 分 割 线 1 的 距离 在 dm 之 内 的 所 有 
点 组 成 的 集合 
P2 是 S2 中 距 分 割 线 1 的 距离 在 dm 之 内 所 有 点 组 成 的 
集合 ; 
将 Pl1 和 P2 中 点 依 其 y 坐标 值 排 序 ; 
并 设 X 和 YY 是 相应 的 已 排 好 序 的 点 列 ; 
通过 扫描 X 以 及 对 于 X 中 每 个 点 检查 Y 中 与 其 距离 在 
dm 之 内 的 所 有 点 (最 多 6 个) 可 以 完成 合并 ; 
当 X 中 的 扫描 指针 逐次 向 上 移动 时 ,Y 中 的 扫描 指针 可 
在 宽 为 2dm 的 区 间 内 移动 ; 
设 dl 是 按 这 种 扫描 方式 找到 的 点 对 间 的 最 小 距离 ; 
.d=min(dm,dl); 


return d; 


i 


~ 
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a 
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下 面 分 析 算 法 cpair2 的 计算 复杂 性 。 设 对 于 7 个 点 的 平面 点 集 S ,算法 耗 时 T(z) 。 算 
法 的 第 1 步 和 第 5 步 用 了 O(Cz) 时 间 。 第 3 步 和 第 6 步 用 了 常数 时 间 。 第 2 步 用 了 2T(CzxY 2) 
时 间 。 若 在 每 次 执行 第 4 步 时 进行 排序 , 则 在 最 坏 情 况 下 第 4 步 要 用 O(Czlogz) 时间。 这 不 
符合 要 求 ,因此 要 做 技术 处 理 。 采 用 设计 算法 时 常用 的 预 排序 技术 , 即 在 使 用 分 治 法 之 前 ， 
预先 将 S 中 个 点 依 其 y 坐标 值 排 好 序 , 设 排 好 序 的 点 列 为 P" 。 在 执行 分 治 法 的 第 4 步 
时 ,只 要 对 已 做 一 次 线性 扫描 , 即 可 抽取 出 所 需要 的 排 好 序 的 点 列 X 和 Y。 然 后 ,在 第 5 
步 中 再 对 X 做 一 次 线性 扫描 , 即 可 求 得 d,。 因 此 ,第 4 步 和 第 5 步 的 两 遍 扫 描 合 在 一 起 只 
要 用 O(n) 时间。 由 此 可 知 ,经 过 预 排 序 处 理 后 的 算法 cpair2 所 需 的 计算 时 间 T(z) 满 足 递 
归 方 程 
0O(1) 入 < 和 
2T(n/2) + O(n) n 宇 4 

由 此 易 知 ,T(n) 二 O(nlogn)。 预 排序 所 需 的 计算 时 间 显然 为 O(nlogn)。 因 此 ,整个 算 
法 所 需 的 计算 时 间 为 O(nlogn)。 在 渐 近 的 意义 下 ,此 算法 已 是 最 优 的 了 。 


T(n) = | 


个 法 设计 与 分 析 ( 第 4 版 ) 


在 具体 实现 算法 cpair2 时 ,用 类 Point 表示 平面 上 的 点 。 


public static class Point 
{ 
double x,y; // 点 坐标 


// 构 造 方 法 
public Point(double xx, double yy) 


分 别 用 类 Pointl 和 Point2 表示 依 zx 坐标 和 依 y 坐标 排序 的 点 。 


public static class Pointl extends Point implements Comparable 
{ 
int id; // 点 编号 


// 构 造 方法 
public Pointl (double xx,double yy,int theID) 
| 

SuperCxxyyy); 

id 一 theID; 


public int compareTo( Object x) 
{ 
double xx 一 ((Pointl) x). x; 
if (this. x<xx) return 一 1; 
if (this. x 一 一 xx) return 0; 


return 1; 


public boolean equals(Object x) 
{return this. x 一 一 ((Point1) x). x;} 
} 
public static class Point2 extends Point implements Comparable 


{ 
int ps // 同 一 点 在 数组 X 中 的 坐标 
// 构 造 方法 
public Point2(double xx,double yy,int pp) 
{ 
super(xx,yy); 


p= pp; 


递 轨 与 分 治 身 略 


} 


DD 


public int compareTo(Object x) 
{ 
double xy 一 ((Point2) x).y; 
if (this. y=<xy) return—1; 
if (this. y== xy) return 0; 
return 1; 


上 


public boolean equals(Object x) 
{return this. y 一 一 ((Point2) x). y;} 


类 Pair 用 于 表示 输出 的 平面 点 对 。 


public static class Pair 
{ 
Pointl ay // 平 面 点 a 
Pointl b; // 平 面 点 b 
double dist; // 平 面 点 a 和 b 间 的 距离 


// 构 造 方法 
public Pair(Pointl aa,Pointl bb,double dd) 
{ 
a 一 aa 
b 一 bb; 
dist= dd; 
} 
} 


平面 上 任意 两 点 和 w 之 间 的 距离 可 计算 如 下 : 


public static double dist(Point u, Point v) 
double dx=u. x—v. x; 
double dy=u. y—v.y; 
return Math. sqrt(dx * dx 十 dyx dy); 
} 


在 算法 cpair2 中 ,用 数组 z 存储 输入 的 点 集 。 在 算法 的 预 处 理 阶段 ,将 数组 z 中 的 点 
依 z 坐标 和 依 > 坐标 排序 , 排 好 序 的 点 集 分 别 存储 在 数组 x 和 数组 y 中 。 经 过 预 排 序 后 ， 
在 算法 的 分 割 阶段 ,将 子 数组 z[:: 门 均匀 地 划分 成 两 个 不 相交 的 子 集 的 任务 就 可 以 在 O(1) 
时 间 内 完成 。 事 实 上 ,只 要 取 闷 =( 十 /2, 则 zC2:z 和 xm 十 1: 门 就 是 满足 要 求 的 分 割 。 
依 y 坐标 排 好 序 的 数组 y 用 于 在 算法 的 合并 步 中 快速 检查 d 矩形 条 内 最 接近 点 对 的 候 
选 者 。 


算法 设计 与 分 折 ( 艇 工厂 ) 


public static Pair cpair2(Pointl [] x) 


{ 


} 


if (x. length 一 2) return null; 


// 依 x 坐 标 排序 
MergeSort. mergeSort(x); 


Point2 [] y=new Point2 [x. length]; 
for (int 一 0;i 一 x.length;i 十 十 ) 
// 将 数组 x 中 的 点 复制 到 数组 y 中 
y[i]=new Point2(x[i]. x, x[i]. y,i); 
MergeSort. mergeSort(y); ”// 依 y 坐标 排序 


Point2 [] z=new Point2 [x. length]; 


// 计 算 最 近 点 对 


return closestPair(x,y,z,0,x. length—1); 


算法 cpair2 中 ,具体 计算 最 接近 点 对 的 工作 由 算法 closestPair 完成 。 


private static Pair closestPair(Pointl [] x,Point2 [] y,Point2 [] z,int l,int r) 


{ 


让 (r 一 ! 一 一 1) //2 点 的 情形 
return new Pair(x[1],x[r],dist(x[1],x[r])); 
if (r 一 ! 一 一 2) 
{//3 点 的 情形 
double dl= dist(x[1] ,x[l+1]); 
double d2= dist(x[l 二 1],x[r]); 
double d3= dist(x[1] ,x[r]); 
if (d1<=d2 && dl<=d3) 
return new Pair(x[1],x[l+1],d1); 
if (d2<=d3) 
return new PairCx[1 十 1],x[r],d2); 
else 
return new Pair(x[1],x[r],d3); 
} 
// 多 于 3 点 的 情形 ,用 分 治 法 
int m 一 (] 十 r)/2; 
int {=1, 
g 一 m 十 1; 
for (int ij 一 1;i 一 一 rii 十 十 ) 
if (y[Li]. p>m) z[g++]=y[Li]; 
else z[f++]=y[i]; 


// 递 归 求 解 


递 轨 与 分 治 身 略 


Pair best 一 closestPair(x,z,y,1,m)， 
Pair right 一 closestPair(x,z,y,m 十 1,r); 2 
if (right. dist<best. dist)best 一 right; 章 


MergeSort. merge(z,y,l,m,r); // 重 构 数 组 y 


//d 矩形 条 内 的 点 置 于 Z 中 
int k=1; 
for (int i=Bi<=#3it+) 
if (Math. abs(x[m]. x—y[i]. x)<best. dist) 
z[k 二 +]=y[]; 
// 搜 索 z[1:k 一 1] 
for (int i=1;i<k;it+) 
{ 
for (int j=i+1;j<k && z0]. y—z[i]. y<best. dist;j 十 十 ) 
double dp= dist(z[i] ,z0j]); 
if (dp=best. dist) 
best=new Pair(x[z[i]. pj ,x[z[j]. pj,dp); 
} 
} 


return best; 


2.11 循环 赛 日 程 表 


分 治 法 不 仅 可 以 用 来 设计 算法 ,而 且 在 其 他 方面 也 有 广泛 的 应 用 。 例 如 ,可 以 用 分 治 思 
想来 设计 电路 ,构造 数学 证 明 等 。 下 面 举 一 个 例子 加 以 说 明 。 

设 有 7 一 2 个 运动 员 要 进行 网 球 循环 赛 。 现 要 设计 一 个 满足 以 下 要 求 的 比赛 日 程 表 : 

(1) 每 个 选手 必须 与 其 他 "一 1 个 选手 各 赛 一 次 。 

(2) 每 个 选手 一 天 只 能 赛 一 次 。 

(3) 循环 赛 一 共 进 行 "一 1 天 。 

按 此 要 求 可 将 比赛 日 程 表 设 计 成 及 行 和 一 1 列 的 表 。 在 表 中 第 i 行 和 第 j 列 处 填 
入 第 i 个 选手 在 第 j 天 所 遇 到 的 选手 。 

按 分 治 策略 ,可 以 将 所 有 的 选手 分 为 两 半 ,n 个 选手 的 比赛 日 程 表 就 可 以 通过 为 n/2 个 
选手 设计 的 比赛 日 程 表 来 决定 。 递 归 地 用 这 种 一 分 为 二 的 策略 对 选手 进行 分 割 , 直 到 只 剩 
下 2 个 选手 时 ,比赛 日 程 表 的 制定 就 变 得 很 简单 。 这 时 只 要 让 这 2 个 选手 进行 比赛 就 可 
可 

图 2-12 所 列 出 的 正方 形 表 是 8 个 选手 的 比赛 日 程 表 。 其 中 ,左上 角 与 左下 角 的 2 小 块 
分 别 为 选手 1 至 选手 4 以 及 选手 5 至 选手 8 前 3 天 的 比赛 日 程 。 据 此 ,将 左上 角 小 块 中 的 
所 有 数字 按 其 相对 位 置 抄 到 右 下 角 ,将 左下 角 小 块 中 的 所 有 数字 按 其 相对 位 置 抄 到 右上 角 ， 
这 样 就 分 别 安排 好 了 选手 1 至 选手 4 以 及 选手 5 至 选手 8 在 后 4 天 的 比赛 日 程 。 依 此 思想 
容易 将 这 个 比赛 日 程 表 推广 到 具有 任意 多 个 选手 的 情形 。 


算法 设计 与 分 折 ( 往 工厂) 
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2-12 8 个 选手 的 比赛 日 程 表 
在 一 般 情况 下 ,算法 可 描述 如 下 : 


public static void table(int k,int [J][] a) 
{ 
int n=1; 
for (int i=1;i<=k;i++)n*=2; 
for (int i=1;i<=n;i++)a[1J[i]=i; 
int m=1; 
for (int s=1;s<=k;s+t+) 
{ 
n/ 一 23 
for (int t=1;t<=n;t++) 
for (int i=m+1;i<=2*# msji 十 十 ) 
for (int j=m+1;j<=2* mjj 十 十 ) 
{ 
a[ 训 [Dj 十 (t 一 1) * mx 2] 一 aLi 一 m]Uj 十 (t 一 1) * mx 2 一 m]; 
a[ 训 Dj 十 (t 一 1) * mx 2 一 m] 一 a[Li 一 m][j 十 (t 一 1) * mx 2]; 


mx 一 2; 


小 结 


本 章 介绍 递归 与 分 治 策略 ,这 是 设计 有 效 算法 最 常用 的 策略 ,也 是 必须 掌握 的 方法 。 递 
归 算 法 结构 清晰 ,可 读 性 强 , 而 且 容易 用 数学 归纳 法 证 明 算法 的 正确 性 ,因此 它 为 设计 算法 、 
调试 程序 带 来 很 大 方便 。 二 分 搜索 技术 、 大 整数 乘法 、Strassen 矩阵 乘法 、 棋 盘 覆 盖 、 合 并 排 
序 ,快速 排序 、 线 性 时 间 选 择 、 最 接近 点 对 问题 循环 赛 日 程 表 等 问题 是 成 功 地 应 用 递归 与 分 
治 策略 的 范例 。 本 章 通 过 这 些 典 型 范例 展示 了 递归 与 分 治 策略 的 深刻 内 涵 与 应 用 技巧 。 


习 题 
2-1 证 明 Hanoi 塔 问题 的 递归 算法 与 非 递 归 算 法 实际 上 是 一 回 事 。 


2-2 下 面 的 7 个 算法 与 本 章 中 的 二 分 搜索 算法 binarySearch 略 有 不 同 。 请 判断 这 7 个 算 
法 的 正确 性 。 如 果 算 法 不 正确 ,请 说 明 产 生 错 误 的 原因 ;如 果 算 法 正确 ,请 给 出 算法 的 


正确 性 证 明 。 


public static int binarySearchl (int [] a,int x,int n) 
{ 
int left 一 0;int right=n—1; 
while (left 一 一 right) 
* 
int middle= (left+ right)/2; 
if (x==a[middle]) return middle; 
if (x>aLmiddle]) left=middle; 
else right= middle; 
} 


return—1; 


public static int binarySearch2(int [] a,int x,int n) 
{ 
int left=0;int right 一 n 一 1; 
while (left<right—1) 
{ 
int middle= (left+ right)/2; 
if (x<a[middle]) right= middle; 
else left=middle; 
’ 
if (x==a[left]) return left; 


else return—1; 


public static int binarySearch3(int [] a,int x,int n) 
{ 
int left=0;int right 一 n 一 1; 
while (left+1!=right) 
{ 
int middle= (left+ right)/2; 
让 (x>=a[middle])left= middle; 
else right=middle; 
} 
让 (x==a[left]) return left; 


else return 一 1; 


public static int binarySearch4(int [] a,int x,int n) 
{ 

让 (n>0&&x>=a[0j) 

{ 


int left 一 0;int right=n—1; 


递 为 与 分 治 策略 


算法 设计 与 分 折 ( 荔 工厂 ) 


While Ol naht 
{ 
int middle= (left+ right) /2; 
让 (x<aLmiddle]) right=middle—1; 
else left= middle; 
} 
if (x==a[left]) return left; 
} 


return—1; 


public static int binarySearchS (int [] a,int x,int n) 
{ 
if (n>0&&x>=a[0]){ 
int left=0;int right 一 n 一 1; 
while (left<right) 


| 
int middle= (left+ right+ 1)/2; 
if (x<a[middle]) right= middle—1; 
else left= middle; 
} 
if (x==a[left]) return left; 
, 
return—1; 


public static int binarySearch6 (int [] a,int x,int n) 
{ 
让 (n>0&&x>=a[0]) 
{ 
int left=0;int right 一 n 一 1; 
while (left<right) 
{ 
int middle 王 (left 十 right 十 1)/2; 
if (x<a[middle]) right=middle—1; 
else left 王 middle 十 1; 
} 
if (x==a[left]) return left; 
} 


return—1; 


public static int binarySearch7(int [ |] a,int x,int n) 
{ 
if (n>0&&x>=a[L0]) 


2-5 


2-6 


递 为 与 分 治 策略 


{ 
int left=0;int right 一 n 一 1; 
while (left<right) 
{ 
int middle= (left 十 right 十 1)/2; 
if (x<aLmiddle]) right= middle; 
else left= middle; 
} 
if (x==a[left]) return left; 
} 
return—1; 


下 


设 a[0:n 一 1 是 已 排 好 序 的 数组 。 请 改写 二 分 搜索 算法 ,使 得 当 搜 索 元 素 x 不 在 数组 
中 时 ,返回 小 于 z 的 最 大 元 素 位 置 i 和 大 于 xz 的 最 小 元 素 位 置 i 。 当 搜索 元 素 在 数组 
中 时 ,i 和 j 相同 , 均 为 z 在 数组 中 的 位 置 。 

给 定 两 个 整数 w 和 w, 它 们 分别 有 wm 入 位 数字 , 且 mm 入 n。 用 通常 的 乘法 求 uv 的 值 
需要 的 OCGmn) 时 间 。 可 以 将 w 和 w 均 看 作 是 有 nn 位 数字 的 大 整数 ,用 本 章 介 绍 的 分 
治 法 ,在 OG 号 ) 时 间 内 计算 wv 的 值 。 当 mm 比 n 小 得 多 时 ,用 这 种 方法 就 显得 效率 不 
够 高 , 试 设计 一 个 算法 ,在 上 述 情况 下 用 OCzmes 2 ) 时 间 求 出 wv 的 值 。 

在 用 分 治 法 求 两 个 位 大 整数 w 和 w 的 乘积 时 ,将 w 和 w 都 分 割 成 长 度 为 na/3 位 的 3 
段 。 证 明 可 以 用 5 次 n/3 位 整数 的 乘法 求 得 uv 的 值 。 按 此 思想 设计 一 个 求 两 个 大 整 
数 乘积 的 分 治 算法 ,并 分 析 算 法 的 计算 复杂 性 。( 提 示 : n 位 的 大 整数 除 以 一 个 常数 
可 以 在 9(n) 时 间 内 完成 。 符 号 9 所 隐 含 的 常数 可 能 依赖 于 k。) 

对 任何 非 零 偶数 ,总 可 以 找到 奇数 mx 和正 整 数 k, 使 得 n= 二 m2*。 为 了 求 出 两 个 n 阶 
矩阵 的 乘积 ,可 以 把 一 个 阶 和 矩阵 分 成 m Xm 个子 矩阵 ,每 个 子 矩 阵 有 2* X24 个 元 
素 。 当 需要 求 2 X 2* 的 子 矩 阵 的 积 时 ,使 用 Strassen 算法 。 设 计 一 个 传统 方法 与 
Strassen 算法 相 结 合 的 矩阵 相 乘 算法 ,对 任何 偶数 ,都 可 以 求 出 两 个 阶 和 矩阵 的 乘 
积 。 并 分 析 算 法 的 计算 时 间 复 杂 性 。 

设 P(7) 二 wo 十 qz 十 … 十 asar” 是 一 个 d 次 多 项 式 。 假 设 已 有 一 算法 能 在 O(i) 时 间 内 
计算 一 个 i 次 多 项 式 与 一 个 1 次 多 项 式 的 乘积 ,以 及 一 个 算法 能 在 O(Gilogi) 时 间 内 计 
算 两 个 i 次 多 项 式 的 乘积 。 对 于 任意 给 定 的 d 个 整数 ,ns,… ,na ,用 分 治 法 设计 一 
个 有 效 算法 ,计算 出 满足 Pm) 二 Plns) 二 … 二 Plma) 二 0 且 最 高 次 项 系数 为 1 的 d 次 
多 项 式 P(z) ,并 分 析 算 法 的 效率 。 

设 n 个 不 同 的 整数 排 好 序 后 存 于 TL[0:n 一 1] 中 。 车 存在 下 标 i, 0 三 i 过 nn, 使 得 
T[ 避 = 设计 一 个 有 效 算法 找到 这 个 下 标 。 要求 算 法 在 最 坏 情况 下 的 计算 时 间 
为 O(logn)。 

设 T[0:n 一 1 是 个 元 素 的 数组 .对 任 一 元 素 xz, 设 SCz) 王 人 1T[i 让 =z}。 当 
1SCz)|>z/2 时 , 称 工 为 了 工 的 主 元 素 。 设 计 一 个 线性 时 间 算 法 ,确定 T[0:n 一 1j 是 否 
有 一 个 主 元 素 。 


2-10 车 在 习题 2-9 中 ,数组 T 中 元 素 不 存在 序 关 系 ,只 能 测试 任意 两 个 元 素 是 否 相等 , 试 
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设计 一 个 有 效 算法 确定 是 否 有 一 主 元 素 。 算 法 的 计算 复杂 性 应 为 O(nlogn) 。 更 进 
一 步 , 能 找到 一 个 线性 时 间 算法 吗 ? 

设 a[0:n 一 1 是 有 个 元 素 的 数组 ,k(0 二 k 二 n 一 1) 是 非 负 整 数 。 试 设计 一 个 算法 将 
子 数组 a[0:&] 与 a[k 十 1:n 一 1] 换 位 。 要 求 算法 在 最 坏 情况 下 耗 时 O(n), 且 只 用 到 
O(1) 的 辅助 空间 。 

设 子 数组 a[0:k] 和 a[k 十 1:n 一 1] 已 排 好 序 (0 过 kn 一 1)。 试 设计 一 个 合并 这 两 个 
子 数组 为 排 好 序 的 数组 a[0:n 一 1] 的 算法 。 要 求 算法 在 最 坏 情况 下 所 用 的 计算 时 间 
为 O(n), 且 只 用 到 0(1) 的 辅助 空间 。 

如 果 在 合并 排序 算法 的 分 割 步 中 ,将 数组 a[0:n 一 1] 划 分 为 LY 个 子 数 组 ,每 个 子 数 
组 中 有 O(Vz) 个 元 素 。 然 后 递归 地 对 分 割 后 的 子 数组 进行 排序 ,最 后 将 所 得 到 的 


[Vzj 个 排 好 序 的 子 数组 合并 成 所 要 求 的 排 好 序 的 数组 a[0;n 一 1]。 设 计 一 个 实现 上 
述 策略 的 合并 排序 算法 ,并 分 析 算 法 的 计算 复杂 性 。 

对 所 给 元 素 存 储 于 数组 中 和 存储 于 链表 中 两 种 情形 , 写 出 自然 合并 排序 算法 。 

给 定数 组 a[0:n 一 1], 试 设计 一 个 算法 ,在 最 坏 情况 下 用 [3n/2 一 2 | 次 比较 找 出 
a[0:n 一 1] 中 元 素 的 最 大 值 和 最 小 值 。 

给 定数 组 a[0:n 一 1], 试 设计 一 个 算法 ,在 最 坏 情况 下 用 nn 十 [logn | 一 2 次 比较 找 出 
a[0:n 一 1] 中 元 素 的 最 大 值 和 次 大 值 。 

设 Si ,Ss，…,S 是 整数 集合 ,其 中 ,每 个 集合 Si(1 志 i<k) 中 整数 取 值 范围 是 1~~n， 


Epy | S; | 二 n, 试 设计 一 个 算法 在 O(n) 时 间 内 将 S1 ,Ss ,…,S, 分 别 排序 。 


试 证 明 ， 在 最 坏 情况 下 . 求 n 个 元 素 组 成 的 集合 S 中 的 第 k 小 元 素 至 少 需要 nn 十 
min(k,n 一 k 十 1) 一 2 次 比较 。 

如 何 修改 算法 qSort 才能 使 其 将 输入 元 素 按 非 增 序 排序 ? 

对 随机 化 算法 ,为 什么 只 分 析 其 平均 情况 下 的 性 能 ,而 不 分 析 其 最 坏 情况 下 的 性 能 ? 
在 执行 算法 randomizedQuicksort 时 ,在 最 坏 情 况 下 ,调用 算法 random 多 少 次 ? 在 
最 好 情况 下 又 怎样 ? 

试 设计 一 个 O(n) 时 间 算 法 ,使 之 能 产生 数组 a[0:n 一 1] 元 素 的 随机 排列 。 

试用 while 循环 消去 算法 qSort 中 的 尾 递归 ,并 比较 消去 尾 递归 前 后 算法 的 效率 。 
试用 栈 来 模拟 递归 ,消去 算法 qSort 中 的 递归 。 并 证 明 所 需 的 栈 空间 为 O(logn) 。 

在 算法 select 中 ,输入 元 素 被 划分 为 5 个 一 组 ,如 果 将 它们 划分 为 7 个 一 组 ,该 算法 
仍然 是 线性 时 间 算 法 吗 ? 划分 成 3 个 一 组 又 怎样 ? 

试 说 明 如 何 修改 快速 排序 算法 ,使 它 在 最 坏 情 况 下 的 计算 时 间 为 O(nlogn) 。 

给 定 由 个 互 不 相同 的 数组 成 的 集合 S 以 及 正 整 数 k 达 nn, 试 设计 一 个 O(n) 时 间 算 
法 找 出 S 中 最 接近 S 的 中 位 数 的 & 个 数 。 

设 XL[0:n 一 1] 和 Y[0:n 一 1] 为 两 个 数组 ,每 个 数组 中 含有 个 已 排 好 序 的 数 。 试 设 
计 一 个 OUdogn) 时 间 的 算法 , 找 出 X 和 YY 的 2n 个 数 的 中 位 数 。 

考查 如 图 2-13 所 示 的 有 两 个 输入 端 和 两 个 输出 端的 两 个 位 置 开 关 。 当 开关 处 于 位 
置 1 时 ,输入 1 和 2 分 别 产生 输出 1 和 2; 当 开关 处 于 位 置 2 时 ,输入 1 和 2 分 别 产生 
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输出 2 和 1。 使 用 这 种 开关 设计 一 个 及 个 输入 端 和 个 输出 端的 开关 网 络 ,实现 
将 输入 的 个 数值 以 它们 的 n! 种 不 同 排列 的 任何 一 种 排列 输出 (通过 开关 位 置 的 
适当 选择 ) 。 要 求 网 络 中 使 用 的 开关 个 数 为 O(nlogn)。 


输入 1 。 ee * 输出 1 
输入 2 。 . 。 输出 2 
位 置 1 
输入 1 。 > 。 输出 1 
输入 2 。 。 输出 2 
位 置 2 


2-13 2 位 置 开关 


天 

对 于 ) 个 带 有 正 权 zl ,zw ,… ,rz , 且 Dw 三 1 的 互 不 相同 的 元 素 zi ,zs ，…,zv ,其 
i=1 

带 权 中 位 数 zx 满足 : 


(1) 试 证 明 xz ,zs，… ,zs 的 不 带 权 中 位 数 是 带 权 ww; 二 1/n,i 王 1,2,…,n 的 带 权 中 
位 数 。 

(2) 说 明 如 何 通 过 排序 ,在 最 坏 情况 下 用 O(nlogn) 时 间 求 出 个 元 素 的 带 权 中 位 数 。 

(3) 说 明 如 何 利 用 一 个 线性 时 间 选 择 算法 (如 Select) ,在 最 坏 情况 下 用 O(n) 时 间 求 
出 个 元 素 的 带 权 中 位 数 。 

(4) 邮局 位 置 问题 定义 为 : 已 知 n 个 点 pis,pso，…,p。s 以 及 与 它们 相 联 系 的 权 rwl， 


吉 ist ,要求 确定 一 点 pCp 不 一 定 是 个 输入 点 之 一 ) ,使 和 式 了 wod Cp， 


pi;) 达到 最 小 , 其 中 d(a,b) 表 示 a 与 b 之 间 的 距离 。 
试 论证 带 权 中 位 数 是 一 维 邮 局 问题 的 最 优 解 。 此 时 d(a,6) 二 la 一 6b|。 
(5) 在 二 维 的 情形 如 何 找 邮局 问题 的 最 优 解 ? 
Gray 码 是 一 个 长 度 为 2" 的 序列 。 序 列 中 无 相同 元 素 , 每 个 元 素 都 是 长 度 为 n 位 的 
串 , 相 邻 元 素 恰 好 只 有 1 位 不 同 。 用 分 治 策略 设计 一 个 算法 对 任意 的 n 构造 相应 的 
Gray 码 。 
设 有 个 运动 员 要 进行 网 球 循环 赛 。 设 计 一 个 满足 以 下 要 求 的 比赛 日 程 表 : 
(1) 每 个 选手 必须 与 其 他 一 1 个 选手 各 赛 一 次 。 
(2) 每 个 选手 一 天 只 能 赛 一 次 。 
(3) 当 是 偶数 时 ,循环 赛 进行 n 一 1 天 ; 当 n 是 奇数 时 ,循环 赛 进行 n 天 。 


第 章 
和 动态 规划 


动态 规划 算法 与 分 治 法 类 似 , 其 基本 思想 也 是 将 待 求解 问题 分 解 成 若干 个 子 问题 , 先 求 
解 子 问题 ,然后 从 这 些 子 问题 的 解 得 到 原 问 题 的 解 。 与 分 治 法 不 同 的 是 ,适合 于 用 动态 规划 
法 求解 的 问题 ,经 分 解 得 到 的 子 问 题 往往 不 是 互相 独立 的 。 若 用 分 治 法 解 这 类 问题 , 则 分 解 
得 到 的 子 问题 数目 太 多 ,以 至 于 最 后 解决 原 问 题 需 要 耗费 指数 时 间 。 然 而 ,不 同 子 问题 的 数 
目 常常 具有 多 项 式 量 级 。 在 用 分 治 法 求解 时 .有些 子 问 题 被 重复 计算 了 许多 次 。 如 果 能 够 
保存 已 解决 的 子 问题 的 答案 ,而 在 需要 时 再 找 出 已 求 得 的 答案 ,就 可 以 避免 大 量 重 复 计 算 ， 
从 而 得 到 多 项 式 时 间 算 法 。 为 了 达到 这 个 目的 ,可 以 用 一 个 表 来 记录 所 有 已 解决 的 子 问题 
的 答案 。 不 管 该 子 问题 以 后 是 否 被 用 到 ,只 要 它 被 计算 过 ,就 将 其 结果 填 人 表 中 。 这 就 是 动 
态 规划 法 的 基本 思想 。 具 体 的 动态 规划 算法 是 多 种 多 样 的 ,但 它们 具有 相同 的 填 表 格式 。 

动态 规划 算法 适用 于 解 最 优化 问题 。 通 常 可 以 按 以 下 步骤 设计 动态 规划 算法 : 

(1) 找 出 最 优 解 的 性 质 , 并 刻画 其 结构 特征 。 

(2) 递归 地 定义 最 优 值 。 

(3) 以 自 底 向 上 的 方式 计算 出 最 优 值 。 

(4) 根据 计算 最 优 值 时 得 到 的 信息 ,构造 最 优 解 。 

步骤 (1) 一 (3) 是 动态 规划 算法 的 基本 步骤 。 在 只 需要 求 出 最 优 值 的 情形 , 步 又 (4) 可 以 
省 去 。 若 需要 求 问题 的 最 优 解 , 则 必须 执行 步骤 (4)。 此 时 ,在 步 又 (3) 中 计算 最 优 值 时 , 通 
常 需 记录 更 多 的 信息 ,以 便 在 步 又 (4) 中 ,根据 所 记录 的 信息 ,快速 构造 出 最 优 解 。 

下 面 以 具体 例子 说 明 如 何 运 用 动态 规划 算法 的 设计 思想 ,并 分 析 可 用 动态 规划 算法 求 
解 的 问题 应 该 具备 的 一 般 特 征 。 


3.1 和 抵 阵 连 乘 问题 


给 定 半 个 矩阵 {4; ,4 ,… ,A,), 其 中 ,A; 与 4;i1 是 可 乘 的 ,i 一 1,2,…,n 一 1]。 考 查 这 nn 个 
矩阵 的 连 乘积 4,4*…4,。 由 于 矩阵 乘法 满足 结合 律 , 故 计算 矩阵 的 连 乘积 可 以 有 许多 不 同 
的 计算 次 序 。 这 种 计算 次 序 可 以 用 加 括号 的 方式 来 确定 。 若 一 个 矩阵 连 乘 积 的 计算 次 序 完 
全 确定 ,也 就 是 说 该 连 乘积 已 完全 加 括号 , 则 可 以 依 此 次 序 反复 调用 2 个 矩阵 相 乘 的 标准 算 
法 计算 出 矩阵 连 乘积 。 完 全 加 括号 的 矩阵 连 乘积 可 递归 地 定义 为 : 

(1) 单个 矩阵 是 完全 加 括号 的 。 

(2) 矩阵 连 乘积 4 是 完全 加 括号 的 . 则 A 可 表示 为 2 个 完全 加 括号 的 矩阵 连 乘 积 B 和 
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C 的 乘积 并 加 括号 , 即 4 一 (BC) 。 
例如 ,和 窍 阵 连 乘积 A1A:A3A4 可 以 有 以 下 5 种 不 同 的 完全 加 括号 方式 : 
(Ai(A,(AsA,))) 
(A1((A,A;:)A,)) 
((AiA,)(A;A,:)) 
((Ai(A,A;))A,) 
(((AiA,)A;)A,) 
每 一 种 完全 加 括号 方式 对 应 于 一 个 矩阵 连 乘积 的 计算 次 序 , 而 矩阵 连 乘 积 的 计算 次 序 
与 其 计算 量 有 密切 关系 。 
首先 考虑 计算 2 个 矩阵 乘积 所 需 的 计算 量 。 
计算 2 矩阵 乘积 的 标准 算法 如 下 ,其 中 ,rae,ca 和 xrb ,cb 分别 表示 和 矩阵 A 和 B 的 行 数 和 
列 数 。 
public static void matrixMultiplyCint [J[Ja, int [JCJb, int CJLle, int ra, int ca, int rb, int cb) 
{ 
if (ca! 一 rb) 
throw new lllegalArgumentException (" 和 矩阵 不 可 乘 ") ; 
for (int i=0; i<ra; i 十 十 ) 
for (int j=0; j<cb; j++) 
{ 
int sum=a[iJ[0] * b[0][Uj]; 
for (int k=1; k<ca; k 十 十 ) 
sumt+=a[i][k] * bLk][j]， 
CLD]=sum; 
} 
} 


和 矩阵 4 和 B 可 乘 的 条 件 是 和 矩阵 4 的 列 数 等 于 矩阵 B 的 行 数 。 若 4 是 一 个 pXg 矩阵 ， 
B 是 一 个 g Xr 矩阵 , 则 其 乘积 C==AB 是 一 个 p Xr 矩阵。 在 上 述 计算 C 的 标准 算法 中 , 主 
要 计算 量 在 3 重 循环 ,总 共 需 要 pgr 次 数 乘 。 

为 了 说 明 在 计算 和 矩阵 连 乘 积 时 ,加 括号 方式 对 整个 计算 量 的 影响 ,考查 计算 3 个 和 矩阵 
{41,4; ,43: } 连 乘积 的 例子 。 设 这 3 个 矩阵 的 维 数 分别 为 10X100,100X5 和 5X50。 若 按 
第 一 种 加 括号 方式 ((4:4*)4s) 计 算 ,3 个 矩阵 连 乘 积 需要 的 数 乘 次 数 为 10X100X5 十 10 久 
5X50= 王 7500。 若 按 第 二 种 加 括号 方式 (4, (4:4;)) 计 算 ,3 个 矩阵 连 乘积 总 共 需 要 10X5X 
50 十 10X100X50 二 75 000 次 数 乘 。 第 二 种 加 括号 方式 的 计算 量 是 第 一 种 加 括号 方式 计算 
量 的 10 倍 。 由 此 可 见 ,在 计算 矩阵 连 乘积 时 ,加 括号 方式 , 则 计算 次 序 对 计算 量 有 很 大 影 
响 。 于 是 ,自然 提出 矩阵 连 乘积 的 最 优 计算 次 序 问 题 , 即 对 于 给 定 的 相继 个 矩阵 {A ,4 ，…， 
4,}( 其 中 矩阵 A; 的 维 数 为 p;_1 Xpi,i 二 1,2,…,n) ,如 何 确定 计算 矩阵 连 乘积 A14，…A4， 的 
计算 次 序 (完全 加 括号 方式 ) ,使 得 依 此 次 序 计算 矩阵 连 乘 积 需 要 的 数 乘 次 数 最 少 。 

穷 举 搜索 法 是 最 容易 想到 的 方法 。 也 就 是 列举 出 所 有 可 能 的 计算 次 序 , 并 计算 出 每 一 
种 计算 次 序 相应 需要 的 数 乘 次 数 ,从 中 找 出 一 种 数 乘 次 数 最 少 的 计算 次 序 。 这 样 做 计算 量 
太 大 。 事 实 上 ,对 于 ?个 矩阵 的 连 乘积 , 设 其 不 同 的 计算 次 序 为 P(z)。 由 于 可 以 先 在 第 天 
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个 和 第 十 1 个 矩阵 之 间 将 原 和 矩阵 序列 分 为 2 个 矩阵 子 序列 ,二 1,2,…,n 一 1; 然 后 分 别 对 
这 2 个 矩阵 子 序列 完全 加 括号 ;最 后 对 所 得 的 结果 加 括号 ,得 到 原 矩 阵 序列 的 一 种 完全 加 括 
号 方式 。 由 此 ,可 以 得 到 关于 P(n) 的 递 推 式 如 下 : 


1 即 一 1 
P(n) = B 


PPO 一 和 n>1 


解 此 递归 方程 可 得 ,P(n) 实 际 上 是 Catalan 数 , 即 P(n) 二 Cn 一 1) ,其 中 ， 
1 2n 3 
Cl(n) = | ]- (4" /123/2 ) 

也 就 是 说 ,P(n) 是 随 n 的 增长 呈 指 数 增长 的 。 因 此 , 穷 举 搜索 法 不 是 一 个 有 效 算法 。 

下 面 考虑 用 动态 规划 法 解 矩 阵 连 乘积 的 最 优 计 算 次 序 问题 。 如 前 所 述 , 按 以 下 几 个 步 
又 进行 。 

1. 分 析 最 优 解 的 结构 

设计 求解 具体 问题 的 动态 规划 算法 的 第 一 步 是 刻画 该 问题 的 最 优 和解 结构 特征 。 对 于 和 矩 
阵 连 乘积 的 最 优 计 算 次 序 问题 也 不 例外 。 首 先 ,为 方便 起 见 , 将 矩阵 连 乘积 4A;+…4; 简 记 
为 A[i: 门 。 考 查 计算 4[1: 妆 的 最 优 计算 次 序 。 设 这 个 计算 次 序 在 矩阵 At 和 A 之 间 将 
矩阵 链 断 开 ,1 夸 &k 二 n, 则 其 相应 的 完全 加 括号 方式 为 ((A1…A4) (CA …4,))。 即 依 此 次 
序 , 先 计算 A[1:&] 和 A[k 十 1:x]], 然 后 将 计算 结果 相 乘 得 到 A[1:nj。 依 此 计算 次 序 ,总 计算 
量 为 A[1:&] 的 计算 量 加 上 A[k 十 1:n]j 的 计算 量 , 再 加 上 A[1:k] 和 A[k 十 1:nj] 相 乘 的 计 
算 量 。 

这 个 问题 的 一 个 关键 特征 是 : 计算 A[1:n]j 的 最 优 次 序 所 包含 的 计算 矩阵 子 链 A[1:&] 
和 A[k 十 1 :nj 的 次 序 也 是 最 优 的。 事实 上 ,车 有 一 个 计算 A[L1:&] 的 次 序 需要 的 计算 量 更 
少 , 则 用 此 次 序 蔡 换 原来 计算 A[1:&] 的 次 序 , 得 到 的 计算 4[1 :站 的 计算 量 将 比 按 最 优 次 序 
计算 所 需 计算 量 更 少 ,这 是 一 个 矛盾 。 同 理 可 知 ,计算 A[1:nj 的 最 优 次 序 所 包含 的 计算 矩 
阵子 链 A[k 十 1:x]j 的 次 序 也 是 最 优 的 。 

因此 ,和 矩阵 连 乘积 计算 次 序 问 题 的 最 优 解 包含 着 其 子 问 题 的 最 优 解 。 这 种 性 质 称 为 最 
优 子 结构 性 质 。 问 题 的 最 优 子 结构 性 质 是 该 问题 可 用 动态 规划 算法 求解 的 显著 特征 。 

2. 建立 递归 关系 

设计 动态 规划 算法 的 第 二 步 是 递归 地 定义 最 优 值 。 对 于 失 阵 连 乘积 的 最 优 计算 次 序 问 
题 ,设计 算 A[i: 站 ,1 三 i 过 j 过 n, 所 需 的 最 少数 乘 次 数 为 m[ 门 [ 门 , 则 原 问 题 的 最 优 值 为 
m[L1j[Ln]。 

当 i=j 时 ,A[i: 站 ==A; 为 单一 矩阵 ,无 需 计 算 , 因 此 ,m[i[i]==0,i==1,2,…,n。 

当 i<j 时 ,可 利用 最 优 子 结构 性 质 计算 m[ 疏 [7]。 事 实 上 , 若 计 算 A[i: 站 的 最 优 次 序 
在 A 和 Aiti 之 间断 开 ,i 才 & 过 j, 则 m[[ 站 =x[ 让 [8j 十 mx[k 十 1j[jj 十 pi_1X piXp;。 由 于 
在 计算 时 并 不 知道 断 开 点 的 位 置 ,所 以 还 未 定 。 不 过 的 位 置 只 有 j 一 i 种 可 能 , 即 kE 
{isi 十 1,…,j 一 1)。 因 此 ,k 是 这 j 一 i 个 位 置 中 使 计算 量 达到 最 小 的 那个 位 置 。 从 而 zz[ 可 
[站 可 以 递归 地 定义 为 


0 
PLD min(mLiLRI + mt 1 + ppipy} < 
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zz[ 训 [ 门 给 出 了 最 优 值 , 即 计算 A[i: 门 所 需 的 最 少数 乘 次 数 。 同 时 还 确定 了 计算 A[i: 门 的 

最 优 次 序 中 的 断 开 位 置 , 也 就 是 说 ,对 于 这 个 有 
m[ijLj] = mLiJ[R]+m[Lg+1]0]+ pi X pe Xp; 

车 将 对 应 于 mm[ 杂 [站 的 断 开 位 置 记 为 s[ 习 [站 ,在 计算 出 最 优 值 mw[ 门 [ 门 后 ,可 递归 地 
由 s[ 训 [7 门 构造 出 相应 的 最 优 解 。 

3. 计算 最 优 值 

根据 计算 mx[ 门 [ 门 的 递归 式 , 容 易 写 一 个 递归 算法 计算 m[1][n]。 稍 后 将 看 到 ,简单 地 
递归 计算 将 耗费 指数 计算 时 间 。 注 意 到 在 递归 计算 过 程 中 ,不 同 的 子 问题 个 数 只 有 0(7z2 ) 
个 。 事 实 上 ,对 于 1i 过 jn 不同 的 有 序 对 (i, 站 对 应 于 不 同 的 子 问 题 。 因 此 ,不 同 子 问 题 
的 个 数 最 多 只 (ro0n+. 由 此 可 见 , 在 递归 计算 时 ,许多 子 问题 被 重复 计算 多 
次 。 这 也 是 该 问题 可 用 动态 规划 算法 求解 的 又 一 显著 特征 。 

用 动态 规划 算法 解 此 问题 ,可 依据 其 递归 式 以 自 底 向 上 的 方式 进行 计算 。 在 计算 过 程 
中 ,保存 已 解决 的 子 问题 答案 。 每 个 子 问题 只 计算 一 次 ,而 在 后 面 需要 时 只 要 简单 查 一 下 ， 
从 而 避免 大 量 的 重复 计算 ,最 终 得 到 多 项 式 时 间 的 算法 。 下 面 所 给 出 的 动态 规划 算法 
matrixChain 中 ,输入 参数 {po ,pi ，,…,p,) 存 储 于 数组 p 中 。 算 法 除了 输出 最 优 值 数组 mx 外 
还 输出 记录 最 优 断 开 位 置 的 数组 ;。 


public static void matrixChain(int [Jp, int [J[Jm, int [JC]s) 
{ 
int n=p. length 一 1; 
for (int i=1; i<=n; i 十 十 ) m[iJ[i]=0; 
for (int r=2; r<=n; r 十 十 ) 
for (int i=1; i<=n—r+1; i 十 十 ) 
{ 
int j=i+r—1; 
m[ij0]=m[i+1J0]+p[Li—1] * pL[i] * p[j]; 
s[iJ0]=i; 
for (int k 一 i 十 1; k<j; k 十 十 ) 
{ 
int t=m[iJ[kJ+m[k+1]0]+pLi—1] * pLk] * pDj]， 
证 Ct<mCiD]){ 
m[i0]=t; 
s[LiJ0]=k;} 


} 


算法 matrixChain, 首 先 计 算出 zx[ 疏 [站 =0.i 二 1,2,…,n。 然 后 ,根据 递归 式 , 按 矩阵 链 
长 递增 的 方式 依次 计算 mx[][i 十 1],i==1,2,…,n 一 1,( 和 矩阵 链 长 度 为 2);m[i][i 十 2],i==1， 
2,…,n 一 2,( 和 矩阵 链 长 度 为 3);……。 在 计算 m[ 引 [jj 时 ,只 用 到 已 计算 出 的 mx[ 让 [&j] 和 
mLk+1]L;]。 

例如 , 设 要 计算 矩阵 连 乘积 4;4:4:444s4s .其 中 各 和 矩 阵 的 维 数 分 别 为 
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4 A A; A 45 As 
30X35 35X15 15X5 5X10 10X20 20X25 
动态 规划 算法 matrixChain 计算 m[ 门 [站 的 先后 次 序 如 图 3-1(a) 所 示 , 计 算 结 果 
[如 [总和 s[J[j]( 其 中 1 专 i 才 j 志 分 别 如 图 3-1(b) 和 (ec) 所 示 。 


了 7 了 
| WE 2 0 和 3 4 5 6 ii 全 可 有“ 
el fi 1 0 15750 7875 9375 11875 15125| i10 1 1 3 3 3 
2 他 0 2625 4375 7125 10500 2 0 
3 3 0 750 2500 5375 3 0 3 3 3 
4 4 0 1000 3500 4 Q 本, 沪 
5 5 0 5000 5 0 5 
6 6 0 6 0 

(a) (b) (9) 


图 3-1 计算 zz[ 可 [的 次 序 


例如 ,在 计算 m[2][L5J 时 , 依 递归 式 有 
m[2J[2] + m[L3J[5]+ pipzps = 0+2500+ 35 X15 X20= 13000 
m[L2j[5j]= minym[L2JL3j 二 mL4jJ[5j 二 pipsps = 2625 二 1000 十 35 X5X20= 7125 
[2][4] +m[L5J[5]+ pipps 一 4375 十 0 十 35 X 10X20 一 11375 
= 7125 
且 &=3, 因 此 ,s[2J[5]=3。 
算法 matrixChain 的 主要 计算 量 取决 于 算法 中 对 ,i 和 的 3 重 循环 。 循环 体内 的 计 
算 量 为 0(1) ,而 3 重 循环 的 总 次 数 为 O(m)。 因 此 ,该 算法 的 计算 时 间 上 界 为 Ol ) 。 算 法 
所 占用 的 空间 显然 为 OQw?)。 由 此 可 见 , 动 态 规划 算法 比 穷 举 搜 索 法 有 效 得 多 。 
4. 构造 最 优 解 
动态 规划 算法 的 第 四 步 是 构造 问题 的 最 优 解 。 算 法 matrixChain 只 是 计算 出 了 最 优 
值 ,并 未 给 出 最 优 解 。 也 就 是 说 ,通过 算法 matrixChain 的 计算 ,只 知道 最 少数 乘 次 数 , 还 不 
知道 具体 应 按 什么 次 序 做 矩阵 乘法 才能 达到 最 少 的 数 乘 次 数 。 
事实 上 ,算法 matrixChain 已 记录 了 构造 最 优 解 所 需要 的 全 部 信息 。s[ 让 [站 中 的 数 
& 表明 计 算 矩 阵 链 4[z: 门 的 最 佳 方式 应 在 矩阵 4 和 4x+ 之 间断 开 , 即 最 优 的 加 括号 方式 应 
为 (A[i:k]) (A[k 十 1: 门 )。 因 此 ,从 s[1j[nj 记 录 的 信息 可 知 计算 AL1: 站 的 最 优 加 括号 方 
式 为 (AL1:s[1j[xj]j) CALs[L1j[wj 十 1:nj)。 而 AL1:sL1j[n] 的 最 优 加 括号 方式 为 (A[1: 
s[1JCsC1jJCwJJJ) CALs[L1jJCsC1jCwjj 十 1:sL1jJ[LsL1j[wj]J)。 同 理 可 以 确定 ALs[1j[nj 十 1: 
nj 的 最 优 加 括号 方式 在 sLs[1j[aj 十 1j[Lnj 处 断 开 ,…… : 照 此 递 推 下 去 ,最 终 可 以 确定 AL1: 
nj] 的 最 优 完全 加 括号 方式 , 即 构造 出 问题 的 一 个 最 优 解 。 
下 面 的 算法 traceback 按 算 法 matrixChain 计算 出 的 断 点 矩阵 * 指示 的 加 括号 方式 输 
出 计算 A[i: 门 的 最 优 计算 次 序 。 
public static void traceback(int [J[]Js, int i, int j) 
{ 


if (i==]) return; 
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traceback(s, i, s[i][j]); 
traceback(s, s[i[0j]+1, j); 
System. out. println("Multiply A” 二 i 二 +”, 十 s[ 训 [j] 十 
"and A"+(s[0J+1)+","+); 
} 
要 输出 AD1 :站 的 最 优 计算 次 序 只 要 调用 上 面 的 traceback(1,n,s) 即 可 。 对 于 上 面 所 举 的 
例子 ,通过 调用 算法 traceback(1,6,s) ,可 输出 最 优 计算 次 序 ((4A, (4:4; ))((444s )4s)) 。 


3.2 动态 规划 算法 的 基本 要 素 


从 计算 矩阵 连 乘积 最 优 计 算 次 序 的 动态 规划 算法 可 以 看 出 ,该 算法 的 有 效 性 依赖 于 问 
题 本 身 所 具有 的 两 个 重要 性 质 : 最 优 子 结构 性 质 和 子 问题 重 倒 性质。 从 一 般 的 意义 上 讲 ， 
问题 所 具有 的 这 两 个 重要 性 质 是 该 问题 可 用 动态 规划 算法 求解 的 基本 要 素 。 这 对 于 在 设计 
求解 具体 问题 的 算法 时 ,是 否 选择 动态 规划 算法 具有 指导 意义 。 下 面 着重 研 究 动态 规划 算 
法 的 这 两 个 基本 要 素 以 及 动态 规划 法 的 变形 一 一 备忘录 方法 。 

1. 最 优 子 结构 

设计 动态 规划 算法 的 第 一 步 通常 是 刻画 最 优 解 的 结构 。 当 问题 的 最 优 解 包 含 了 其 子 问 
题 的 最 优 解 时 , 称 该 问题 具有 最 优 子 结构 性 质 。 问 题 的 最 优 子 结构 性 质 提供 了 该 问题 可 用 
动态 规划 算法 求解 的 重要 线索 。 

在 矩阵 连 乘积 最 优 计算 次 序 问题 中 ,注意 到 , 若 A14s…A， 的 最 优 完全 加 括号 方式 在 4 
和 At 之 间 将 矩阵 链 断 开 , 则 由 此 确定 的 子 链 A1A2…As 和 AnriAt+2…A， 的 完全 加 括号 方 
式 也 是 最 优 的 。 也 就 是 说 该 问题 具有 最 优 子 结构 性 质 。 在 分 析 该 问题 的 最 优 子 结构 性 质 
时 ,所 用 的 方法 具有 普遍 性 。 首 先 假设 由 问题 的 最 优 解 导出 的 子 问题 的 解 不 是 最 优 的 ,然后 
再 设法 说 明 在 这 个 假设 下 可 构造 出 比 原 问题 最 优 解 更 好 的 解 ,从 而 导致 矛盾 。 

在 动态 规划 算法 中 ,利用 问题 的 最 优 子 结构 性 质 ,以 自 底 向 上 的 方式 递归 地 从 子 问题 的 
最 优 解 逐步 构造 出 整个 问题 的 最 优 解 。 算 法 考查 的 子 问 题 空 间 的 规模 较 小 。 例 如 ,在 矩阵 
连 乘积 最 优 计算 次 序 问 题 中 , 子 问题 空间 由 矩阵 链 的 所 有 不 同 子 链 组 成 。 所 有 不 同 子 链 的 
个 数 为 9(x?) ,因而 子 问题 空间 的 规模 为 9(x ) 。 

2. 重合 子 问 题 

可 用 动态 规划 算法 求解 的 问题 应 该 具备 的 另 一 个 基本 要 素 是 子 问题 的 重 肥 性质。 也 就 
是 说 ,在 用 递归 算法 自 顶 向 下 求解 问题 时 ,每 次 产生 的 子 问题 并 不 总 是 新 间 题 ,有 些 子 问 题 
被 反复 计算 多 次 。 动 态 规划 算法 正 是 利用 了 这 种 子 问题 的 重 琶 性 质 ,对 每 一 个 子 问 题 只 解 
一 次 ,而 后 将 其 解 保存 在 一 个 表格 中 , 当 再 次 需要 解 此 子 问 题 时 ,只 是 简单 地 用 常数 时 间 查 
看 一 下 结果 。 通 常 , 不 同 的 子 问 题 个 数 随 问 题 的 大 小 呈 多 项 式 增长 。 因 此 ,用 动态 规划 算法 
通常 只 需要 多 项 式 时 间 , 从 而 获得 较 高 的 解 题 效 率 。 

为 了 说 明 这 一 点 ,考虑 计算 矩阵 连 乘 积 最 优 计算 次 序 时 ,利用 递归 式 直 接 计算 A[i: 门 的 
递归 算法 recurmatrixChain 。 

public static int recurMatrixChain(int i, int j) 

{ 


CD 
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if (i==j) return 0; 
int u 一 recurMatrixChain(i 十 1,j) 十 pLi 一 1]* pLi] * p[j]; 
s[iJ0G]=i; 
for (int k=i+1; k<j; k++) 
* 
int t 一 recurMatrixChain(i,k) +recurMatrixChain(k+1,))+p[i—1] * pL[k] * p[j]; 
if (t<u) 
{ 
u=t; 
s[iJ0]=k; 
} 
} 
return u; 


用 算法 recurmatrixChain(1,4) 计 算 A[1:4] 的 递归 树 如 图 3-2 所 示 。 从 该 图 可 以 看 出 ， 
许多 子 问题 被 重复 计算 。 


1:2 


2:21|3:41|2:31|4:4|| 1: 


2:2][3:3][4:4] [1:1] [2:3] [1:2] [3:3 


3:3] [44] [222] B3 E23] B3] [CI [22 


3-2 计算 A[1:4] 的 递归 树 


事实 上 ,可 以 证 明 该 算法 的 计算 时 间 T(n) 有 指数 下 界 。 设 算法 中 判断 语句 和 赋值 语句 
花费 常数 时 间 , 则 由 算法 的 递归 部 分 可 得 关于 T(z) 的 递归 不 等 式 如 下 : 


0O(1) n=1 
T(n) =| 


他 一 
1 十 >)(CTO) 十 TOz 一 妨 十 D) n>1 
k=1 


因此 , 当 n>1 时 ,有 


n—l nl wi 
TCD) 1+—D+ oO TH + Ta-—A) =n+22 TCD) 


据 此 ,可 用 数学 归纳 法 证 明 T(x) 宇 2”! 一 Q(2”)。 

因此 ,直接 递归 算法 recurmatrixChain 的 计算 时 间 随 盖 指数 增长 。 相 比 之 下 , 解 同一 问 
题 的 动态 规划 算法 matrixChain 只 需 计 算 时 间 OG ) 。 其 有 效 性 就 在 于 它 充 分 利用 了 问题 
的 子 问 题 重 友 性 质 。 不 同 的 子 问题 个 数 为 9(x? ) ,而 动态 规划 算法 对 于 每 个 不 同 的 子 问题 
只 计算 一 次 ,从 而 节省 了 大 量 不 必要 的 计算 。 由 此 也 可 看 出 , 当 解 某 一 问题 的 直接 递归 算法 
所 产生 的 递归 树 中 ,相同 的 子 问题 反复 出 现 , 并 且 不 同 子 问题 的 个 数 又 相对 较 少 时 ,用 动态 
规划 算法 是 有 效 的 。 

3. 备忘录 方法 

备忘录 方法 是 动态 规划 算法 的 变形 。 与 动态 规划 算法 一 样 ,备忘录 方法 用 表格 保存 已 
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解决 的 子 问 题 的 答案 ,在 下 次 需要 解 此 子 问题 时 ,只 要 简单 地 查看 该 子 问题 的 解答 ,而 不 必 
重新 计算 。 与 动态 规划 算法 不 同 的 是 ,备忘录 方法 的 递归 方式 是 自 顶 向 下 的 ,而 动态 规划 算 
法 则 是 自 底 向 上 递归 的 。 因 此 ,备忘录 方法 的 控制 结构 与 直接 递归 方法 的 控制 结构 相同 ,区 
别 在 于 备忘录 方法 为 每 个 解 过 的 子 问 题 建 立 了 备忘录 以 备 需要 时 查看 ,避免 了 相同 子 问 题 
的 重复 求解 。 
备忘录 方法 为 每 个 子 问题 建立 一 个 记录 项 ,初始 化 时 ,该 记录 项 存 人 一 个 特殊 值 ,表示 
该 子 问题 尚未 求解 。 在 求解 过 程 中 ,对 每 个 待 求 子 问题 ,首先 查看 其 相应 的 记录 项 。 若 记录 
项 中 存储 的 是 初始 化 时 存 人 的 特殊 值 , 则 表示 该 子 问题 是 第 一 次 遇 到 ,此 时 计算 出 该 子 问题 
的 解 , 并 保存 在 其 相应 的 记录 项 中 ,以 备 以 后 查看 。 若 记录 项 中 存储 的 已 不 是 初始 化 时 存 人 
的 特殊 值 , 则 表示 该 子 问题 已 被 计算 过 ,其 相应 的 记录 项 中 存储 的 是 该 子 问题 的 解答 。 此 
时 ,只 要 从 记录 项 中 取出 该 子 问题 的 解答 即 可 ,而 不 必 重 新 计算 。 
下 面 的 算法 memoizedmatrixChain 是 解 矩 阵 连 乘 积 最 优 计算 次 序 问 题 的 备忘录 方法 。 
public static int memoizedmatrixChain(int n) 
{ 
for (int i=1; i<=n; i 十 十 ) 
for (int j=i; j<=n; j 十 十 ) 
m[iJ[0j]=0; 
return lookupChain(1,n); 


} 


Private static int lookupChain(int i, int j) 
{ 
if (m[iJ[j]>0) return m[i]0)]; 
if (i==j) return 0; 
int u=lookupChain(i+1,j))+p[i—1] * p[i] * pD]， 
s[iJ0]=i; 
for (int k 一 i 十 1; k<j; k 十 十 ) 
{ 
int t 一 lookupChain(i,k) 十 lookupChain(k 十 1,j) 十 pLi 一 I]* pLk] * pD]; 
让 Ct<u){ 
u=t; 


s[iJ0]=k;} 


} 
m[i0]=u; 
return u; 


} 


与 动态 规划 算法 matrixChain 一 样 ,备忘录 算法 memoizedmatrixChain 用 数组 m 记录 
子 问 题 的 最 优 值 。m 初始 化 为 0, 表示 相应 的 子 问 题 还 未 被 计算 。 在 调用 lookupChain 时 ， 
若 m[ 疏 [7 站 记 0, 则 表示 其 中 存储 的 是 所 要 求 子 问题 的 计算 结果 ,直接 返回 此 结果 即 可 。 否 
则 与 直接 递归 算法 一 样 , 自 顶 向 下 地 递归 计算 ,并 将 计算 结果 存 和 mx[ 门 [jj 后 返回 。 因 此 ， 
算法 lookupChain 总 能 返回 正确 的 值 ,但 仅 在 它 第 一 次 被 调用 时 计算 ,以 后 的 调用 就 直接 返 
回 计 算 结果 。 
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与 动态 规划 算法 一 样 ,备忘录 算法 memoizedmatrixChain 耗 时 O(mw)。 事 实 上 ,共有 
On ) 个 备 忘 记录 项 x[[ 站 ,i 二 1,2,… ,nsj 二 i,…,n。 这 些 记 录 项 的 初始 化 耗费 Or? ) 时 
间 。 每 个 记录 项 只 填 人 一次。 每 次 填 人 时 ,不 包括 填 人 其 他 记录 项 的 时 间 , 共 耗 费 O(n) 时 
间 。 因 此 ,算法 lookupChain 填 入 OC? ) 个 记录 项 总 共 耗 费 O(n ) 计 算 时 间 。 由 此 可 见 , 通 
过 使 用 备忘录 技术 ,直接 递归 算法 的 计算 时 间 从 2(2") 降 至 O(n ) 。 

综 上 所 述 ,矩阵 连 乘 积 的 最 优 计算 次 序 问题 可 用 自 顶 向 下 的 备忘录 算法 或 自 底 向 上 的 
动态 规划 算法 在 OG ) 计 算 时 间 内 求解 。 这 两 个 算法 都 利用 了 子 问题 重 琶 性 质 。 总 共有 
9 ) 个 不 同 的 子 问 题 。 对 每 个 子 问 题 ,两 种 方法 都 只 解 一 次 ,并 记录 答案 。 再 次 遇 到 该 子 
问题 时 ,不 重新 求解 而 简单 地 取 用 已 得 到 的 答案 。 因 此 ,节省 了 计算 量 , 提 高 了 算法 的 效率 。 

一 般 地 讲 , 当 一 个 问题 的 所 有 子 问题 都 至 少 要 解 一 次 时 ,用 动态 规划 算法 比 用 备忘录 方 
法 好 。 此 时 ,动态 规划 算法 没有 任何 多 余 的 计算 。 同 时 ,对 于 许多 问题 , 常 可 利用 其 规则 的 
表格 存 取 方 式 ,减少 动态 规划 算法 的 计算 时 间 和 空间 需求 。 当 子 问题 空间 中 的 部 分 子 问 题 
可 不 必 求 解 时 ,用 备忘录 方法 则 较 有 利 , 因 为 从 其 控制 结构 可 以 看 出 ,该 方法 只 解 那些 确实 
需要 求解 的 子 问题 。 


3.3 最 长 公共 子 序列 


一 个 给 定 序列 的 子 序列 是 在 该 序列 中 删 去 若干 元 素 后 得 到 的 序列 。 确 切 地 说 , 若 给 定 
序列 == {zi ,x2 Xn) , 则 另 一 序列 Z 二 {zi ,zs。，… ,zi),X 的 子 序列 是 指 存在 一 个 严格 递 
增 下 标 序 列 { 纪 ,is，…,ii) 使 得 对 于 所 有 j= 二 1,2,…,k 有 ;二 x;;。 例 如 ,序列 Z=={B,C,D， 
B} 是 序列 X= 二 {A,B,C,B,D,A,B} 的 子 序 列 , 相 应 的 递增 下 标 序列 为 {2,3,5,7)。 

给 定 两 个 序列 X 和 YY, 当 另 一 序列 Z 既是 X 的 子 序列 又 是 Y 的 子 序列 时 , 称 Z 是 序列 
X 和 Y 的 公共 子 序列 。 

例如 ,车 X={A,B,C,B,D,A,B},Y={B,D,C,A,B,A}, 序 列 {B,C,A} 是 X 和 Y 的 
一 个 公共 子 序列 ,但 它 不 是 X 和 YY 的 最 长 公共 子 序列 。 序 列 {B,C,B,A}) 也 是 X 和 YY 的 一 
个 公共 子 序列 , 它 的 长 度 为 4, 而 且 它 是 X 和 Y 的 最 长 公共 子 序列 ,因为 X 和 YY 没有 长 度 大 
于 4 的 公共 子 序列 。 

最 长 公共 子 序列 问题 ; 给 定 两 个 序列 X 一 {ziyz ,zm) 和 YY 二 {yi ,yz，… ys), 找 出 
XX 和 YY 的 最 长 公共 子 序列 。 

动态 规划 算法 可 有 效 地 解 此 问题 。 下 面 按照 动态 规划 算法 设计 的 各 个 步骤 设计 解 此 问 
题 的 有 效 算法 。 

1. 最 长 公共 子 序列 的 结构 

穷 举 搜索 法 是 最 容易 想到 的 算法 。 对 X 的 所 有 子 序列 ,检查 它 是 否 也 是 Y 的 子 序列 ， 
从 而 确定 它 是 否 为 X 和 YY 的 公共 子 序列 。 并 且 在 检查 过 程 中 记录 最 长 的 公共 子 序列 。X 
的 所 有 子 序列 都 检查 过 后 即 可 求 出 X 和 YY 的 最 长 公共 子 序列 。X 的 每 个 子 序列 相应 于 下 
标 集 {1,2,…,m)}) 的 一 个 子 集 。 因 此 ,共有 2” 个 不 同 子 序列 ,从 而 穷 举 搜 索 法 需要 指数 
时 间 。 

事实 上 ,最 长 公共 子 序列 问题 具有 最 优 子 结构 性 质 。 

设 序列 X={z,zz,…,zo) 和 Y={yyvy ,yy)} 的 最 长 公共 子 序列 为 Z== {xz1 ,zs ，…， 
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拉 ), 则 

(1) 车 z= 二 yy 则 二 zm 二 yr, 且 DZ :是 X。 和 Yi 的 最 长 公共 子 序列 。 

(2) 若 zw 天 且 zi 关 zm, 则 Z 是 X,_1 和 YY 的 最 长 公共 子 序列 。 

(3) 若 zs 天 且 zx 天 ww, 则 Z 是 X 和 YY,-1 的 最 长 公共 子 序列 。 

其 中 ,Xi 二 {ziyT2 9 Tn) 3Y 1 二 {yyy Ya) Ze 1 = {21 zz，…2kt-l)。 

证 明 : (1) 用 反 证 法 。 若 拉 关 zw, 则 {z zs, ,zi ,zm} 是 XX 和 YY 的 长 度 为 & 十 1 的 公共 
子 序列 。 这 与 Z 是 X 和 YY 的 最 长 公共 子 序列 矛盾 。 因 此 , 必 有 惟一 zw 一 mm。 由 此 可 知 
Zi-: 是 XX。-1 和 YY,-1 的 长 度 为 k 一 1 的 公共 子 序列 。 若 X。-!1 和 YY,-! 有 长 度 大 于 一 1 的 公共 
子 序列 W, 则 将 zw 加 在 其 尾部 产生 X 和 YY 的 长 度 大 于 的 公共 子 序列 。 此 为 矛盾 。 故 
Zi: 是 Xi 和 Y,-: 的 最 长 公共 子 序列 。 

(2) 由 于 xx 夫 zw,Z 是 Xi 和 YY 的 公共 子 序列 。 若 X,_! 和 YY 有 长 度 大 于 k 的 公共 子 
序列 WW, 则 W 也 是 X 和 Y 的 长 度 大 于 k 的 公共 子 序列 。 这 与 Z 是 X 和 YY 的 最 长 公共 子 序 
列 矛 盾 。 由 此 即 知 ,Z 是 X。: 和 Y 的 最 长 公共 子 序列 。 

(3) 证 明 与 (2) 类 似 。 

由 此 可 见 , 两 个 序列 的 最 长 公共 子 序列 包含 了 这 两 个 序列 的 前 级 的 最 长 公共 子 序列 。 
因此 ,最 长 公共 子 序列 问题 具有 最 优 子 结构 性 质 。 

2. 于 问题 的 递归 结构 

由 最 长 公共 子 序列 问题 的 最 优 子 结构 性 质 可 知 ,要 找 出 X= {zi ,zo，… ,zm) 和 
Y= 二 (yi,y2，… ,yn} 的 最 长 公共 子 序列 ,可 按 以 下 方式 递归 计算 : 当 zw 一 ww 时 , 找 出 Xi 和 
Yi1 的 最 长 公共 子 序列 ,然后 在 其 尾部 加 上 xz, (二 y,) 即 可 得 X 和 YY 的 最 长 公共 子 序列 。 
当 zw 天 ww 时 ,必须 解 两 个 子 问题 , 即 找 出 Xe 和 了 Y 的 一 个 最 长 公共 子 序列 及 X 和 Y-: 的 
一 个 最 长 公共 子 序列 。 这 两 个 公共 子 序列 中 较 长 者 即 为 X 和 YY 的 最 长 公共 子 序列 。 

由 此 递归 结构 容易 看 到 最 长 公共 子 序列 问题 具有 子 问 题 重生 性 质 。 例 如 ,在 计算 X 和 
Y 的 最 长 公共 子 序列 时 ,可 能 要 计算 XX 和 YY,-1 及 X,-!1 和 YY 的 最 长 公共 子 序 列 。 而 这 两 个 
子 问题 都 包含 一 个 公共 子 问题 , 即 计算 X。- 和 Y,-; 的 最 长 公共 子 序列 。 

首先 建立 子 问题 最 优 值 的 递归 关系 。 用 c[ 门 [7] 记录 序列 X 和 YY; 的 最 长 公共 子 序列 
的 长 度 。 其 中 ,Xi== {zi Tos yTi) Yj 二 {yyyo，"… ,Yj)}。 当 i 二 0 或 j=0 时, 空 序列 是 X， 
和 YY; 的 最 长 公共 子 序列 ,故此 时 c[ 杂 [二 0。 在 其 他 情况 下 ,由 最 优 子 结构 性 质 可 建立 递 
归 关 系 如 下 : 

0 i=0, j=0 
cLiIL;j= cLi—1J0—1J+1 i,j>0; zi=y; 
max{c[i0—1],c[i—1J07]} i,j>0s zy 

3. 计算 最 优 值 

直接 利用 递归 式 容易 写 出 计算 c[ 阅 [站 的 递归 算法 ,但 其 计算 时 间 是 随 输入 长 度 指数 增 
长 的 。 由 于 在 所 考虑 的 子 问题 空间 中 ,总 共有 9(mn) 个 不 同 的 子 问 题 ,因此 ,用 动态 规划 算 
法 自 底 向 上 地 计算 最 优 值 能 提高 算法 的 效率 。 

计算 最 长 公共 子 序列 长 度 的 动态 规划 算法 lcsLength 以 序列 X= {zi ,zz ,… ,zw} 和 Y 一 
{yiyy ,作为 输入 。 输 出 两 个 数组 c 和 0。 其 中 ,c[ 让 [7 门 存储 X 和 YY; 的 最 长 公共 子 
序列 的 长 度 ,6[ 杂 [站] 记录 c[ 疏 [7] 的 值 是 由 哪 一 个 子 问题 的 解 得 到 的 ,这 在 构造 最 长 公共 子 
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序列 时 要 用 到 。 问 题 的 最 优 值 , 即 X 和 YY 的 最 长 公共 子 序列 的 长 度 记录 于 cLmj[nj 中 。 


public static int lesLength(char [Jx, char [Jy, int [J[]Jb) 
{ 
int m=x. length 一 1; 
int n 一 y. length 一 1; 
int [J[Jc=new int [m 十 1][n 十 1]; 
for (int i=1; i 一 mi i++) c[iJ[0]=0; 
for (int i=1; i<=n; i 十 十 ) cL0J[i]=0; 
for (int i=1; i<=m; i 十 十 ) 
for (int j=1; j<=n; j++) 
{ 
if (x[i]==y[0j]) 
‘ 
cI0]=cLi—1J0—1J+1; 
b[iJ0]=1; 
} 
else if (c[i—1]J0]>=c[i0—1]) 
{ 
cI0J=c[Li—1J0]; 
b[ij0]=2; 
} 
else 
{ 
LIC0]=c[0—1]; 
b[ij0]=3; 


} 
} 
return cLm][n]; 


} 


由 于 每 个 数组 单元 的 计算 耗费 O(1) 时 间 , 算 法 lcsLength 耗 时 OCmn)。 

4. 构造 最 长 公共 子 序列 

由 算法 lcsLength 计算 得 到 的 数组 5 可 用 于 快速 构造 序列 X = {ziyza,…，,zn) 和 
Y 二 {y1,y2，"… ,yn) 的 最 长 公共 子 序列 。 首 先 从 bLmj[Lnj 开 始 , 依 其 值 在 数组 5 中 搜索 。 当 
5[ 让 [j= 二 1 时 ,表示 X; 和 YY; 的 最 长 公共 子 序列 是 由 X;_1 和 YY;-1 的 最 长 公共 子 序列 在 尾部 
加 上 zx; 所 得 到 的 子 序列 ; 当 65[ 让 [j= 二 2 时 ,表示 X 和 YY; 的 最 长 公共 子 序列 与 X;_ 1 和 YY; 的 
最 长 公共 子 序列 相同 ; 当 5b[ 让 [jj 二 3 时 ,表示 X 和 YY; 的 最 长 公共 子 序列 与 X; 和 YY;-1 的 最 
长 公共 子 序列 相同 。 

下 面 的 算法 lcs 实现 根据 6 的 内 容 打印 出 X; 和 YY; 的 最 长 公共 子 序列 。 通 过 算法 调用 
lcs(m,n,x,b) 便 可 打印 出 序列 X 和 YY 的 最 长 公共 子 序列 。 

public static void les(int i,int j ,char [ Jx,int [J[ Jb) 

{ 


if (i==0 || j==0) return; 
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if (b[iJ[j]==1) 

{ 
lecs(i 一 1,j 一 1,xyb); 
System. out. print(x[i]); 

} 

else if Cb[iJ0]==2) lcs(i 一 1,j,xyb)， 
else lcs(i,j—1,x,b); 


上 


在 算法 lcs 中 ,每 一 次 递归 调用 使 i 或 j 减 1, 因 此 算法 的 计算 时 间 为 Ol(m 十 n)。 

5. 算法 的 改进 

对 于 具体 问题 ,按照 一 般 的 算法 设计 策略 设计 出 的 算法 ,往往 在 算法 的 时 间 和 空间 需求 
上 还 有 较 大 的 改进 余地 。 通 常 可 以 利用 具体 问题 的 一 些 特殊 性 对 算法 做 进一步 改进 。 例 
如 ,在 算法 lcsLength 和 lcs 中 ,可 进一步 将 数组 省 去 。 事 实 上 ,数组 元 素 c[ [的 值 仅 由 
ci 一 1 一 1j,c[i 一 1J[j 和 c[i[j 一 1j 这 3 个 数组 元 素 的 值 所 确定 。 对 于 给 定 的 数组 元 
素 c[ 让 [7 门 ,可 以 不 借助 于 数组 而 仅 借助 于 c 本 身 ,在 O(1) 时 间 内 确定 c[ 避 [站 的 值 是 由 
ci 一 1 一 1j,c[i 一 1J[j 和 c[ij[ 一 1] 中 哪 一 个 值 所 确定 的 。 因 此 ,可 以 写 一 个 类 似 于 
lcs 的 算法 ,不 用 数组 5 而 在 OCm 十 nn) 时 间 内 构造 最 长 公共 子 序列 。 从 而 可 节省 9(mn) 的 空 
间 。 由 于 数组 c 仍 需要 0(mzz ) 的 空间 ,因此 ,在 渐 近 的 意义 上 ,算法 仍 需 要 0Cmn) 的 空间 ,所 
做 的 改进 ,只 是 对 空间 复杂 性 的 常数 因子 的 改进 。 

另外 ,如 果 只 需要 计算 最 长 公共 子 序列 的 长 度 , 则 算法 的 空间 需求 可 大 大 减少 。 事 实 
上 ,在 计算 [说 [ 门 时 ,只 用 到 数组 c 的 第 i 行 和 第 i 一 1 行 。 因此 ,用 两 行 的 数组 空间 就 可 以 
计算 出 最 长 公共 子 序列 的 长 度 。 进 一 步 的 分 析 还 可 以 将 空间 需求 减 至 O (min{m.n})。 


3.4 凸 多 边 形 最 优 三 角 剖 分 


用 动态 规划 算法 能 有 效 地 解 凸 多 边 形 的 最 优 三 角 训 分 问题 。 尽 管 这 是 一 个 几何 问题 ， 
但 在 本 质 上 它 与 矩阵 连 乘积 的 最 优 计算 次 序 问 题 极 为 相似 。 

多 边 形 是 平面 上 一 条 分 段 线性 闭 曲线 。 也 就 是 说 ,多 边 形 是 由 一 系列 首尾 相 接 的 直线 
段 所 组 成 的 。 组 成 多 边 形 的 各 直线 段 称 为 该 多 边 形 的 边 。 连 接 多 边 形 相继 两 条 边 的 点 称 为 
多 边 形 的 顶点 。 若 多 边 形 的 边 除 了 连接 顶点 外 没有 别 的 交点 , 则 称 该 多 边 形 为 一 简单 多 边 
形 。 一 个 简单 多 边 形 将 平面 分 为 3 个 部 分 : 被 包围 在 多 边 形 内 的 所 有 点 构成 了 多 边 形 的 内 
部 ;多 边 形 本 身 构成 多 边 形 的 边界 ;而 平面 上 其 余 包 围 着 多 边 形 的 点 构成 了 多 边 形 的 外 部 。 
当 一 个 简单 多 边 形 及 其 内 部 构成 闭 凸 集 时 , 称 该 简单 多 边 形 为 一 凸 多 边 形 。 也 就 是 说 , 凸 多 
边 形 边界 上 或 内 部 的 任意 两 点 所 连 成 的 直线 段 上 所 有 点 均 在 凸 多 边 形 的 内 部 或 边界 上 。 

通常 ,用 多 边 形 顶 点 的 道 时针 序列 表示 贞 多 边 形 , 即 P= 二 {vo ,vi,…,v,-1) 表 示 具 有 nn 条 
边 wm uvw，……w-iuws 的 凸 多 边 形 。 其 中 ,约定 wo 二 vw。 

车 v; 与 v; 是 多 边 形 上 不 相 邻 的 两 个 顶点 , 则 线段 viv; 称 为 多 边 形 的 一 条 弦 。 弦 viv; 
将 多 边 形 分 割 成 两 个 多 边 形 {v; vir1，…,v;} 和 {vj ,vjt1，*… vi}。 

多 边 形 的 三 角 剖 分 是 将 多 边 形 分 割 成 互 不 相交 的 三 角形 的 弦 的 集合 T。 图 3-3(a) 和 
(b) 是 一 个 凸 七 边 形 的 两 个 不 同 的 三 角 剖 分 。 


CD 
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在 凸 多 边 形 P 的 三 角 剖 分 T 中 ,各 弦 互 不 相交 , 且 集 合 全 已 达到 最 大 , 即 P 的 任 一 不 
在 工 中 的 弦 必 与 工 中 某 一 弦 相 交 。 在 有 ?个 顶点 的 凸 多 边 形 的 三 角 剖 分 中 , 恰 有 7 一 3 条 
弦 和 7 一 2 个 三 角形 。 

凸 多 边 形 最 优 三 角 训 分 的 问题 : 给 定 凸 多 边 形 PP 一 {z ,mm ,zw 下 以 及 定义 在 由 多 
边 形 的 边 和 弦 组 成 的 三 角形 上 的 权 函 数 zww。 要 求 确定 该 凸 多 边 形 的 三 角 剖 分 ,使 得 该 三 角 
剖 分 所 对 应 的 权 , 即 该 三 角 剖 分 中 诸 三 角形 上 权 之 和 为 最 小 。 


vo vo 
wh 


Us Us 


(a) (b) 
3-3 一 个 凸 七 边 形 的 两 个 不 同 的 三 角 剖 分 


可 以 定义 三 角形 上 各 种 各 样 的 权 函 数 ww。 例 如 
(Coroiuk) 一 | viv; | 十 | wwx | 十 | vw; | 

其 中 , |viv; | 是 点 v; 到 wj 的 欧 氏 距离 。 相 应 于 此 权 函 数 的 最 优 三 角 训 分 即 为 最 小 弦 长 三 角 
剖 分 。 

本 节 所 述 算法 可 适用 于 任意 权 函 数 。 

1. 三 角 剖 分 的 结构 及 其 相关 问题 

凸 多 边 形 的 三 角 剖 分 与 表达 式 的 完全 加 括号 方式 之 间 具 有 十 分 紧密 的 联系 。 正 如 所 看 
到 的 ,和 矩阵 连 乘积 的 最 优 计算 次 序 问 题 等 价 于 和 矩阵 链 的 最 优 完全 加 括号 方式 。 这 些 问 题 之 
间 的 相关 性 可 从 它们 所 对 应 的 完全 二 又 树 的 同 构 性 看 出 。 

一 个 表达 式 的 完全 加 括号 方式 相应 于 一 棵 完全 二 又 树 , 称 为 表达 式 的 语法 树 。 例 如 , 完 
全 加 括号 的 矩阵 连 乘积 ((4, (4:4:))(44, (4s4s))) 相 应 的 语法 树 如 图 3-4 Ca) 所 示 。 


4 mm 
kal 
We 
42 
46 
tp 
Us 
4 44 43 As 
A A; 45 46 De 全 0 
4 
(b) 


(a) 
图 3-4 表达 式 语 法 树 与 三 角 剖 分 的 对 应 


语法 树 中 每 一 个 叶 结 点 表示 表达 式 中 一 个 原子 。 在 语法 树 中 , 若 一 结 点 有 一 个 表示 表 
达 式 Ei 的 左 子 树 ,以 及 一 个 表示 表达 式 E, 的 右 子 树 , 则 以 该 结 点 为 根 的 子 树 表示 表达 式 
(EE,)。 因 此 ,有 个 原子 的 完全 加 括号 表达 式 对 应 于 唯一 的 一 棵 有 nn 个 叶 结 点 的 语法 树 ， 
反之 亦 然 。 
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凸 多 边 形 {z ,wm ,…,uw-i) 的 三 角 训 分 也 可 以 用 语法 树 表 示 。 例 如 ,图 3-4 (a) 中 凸 多 
边 形 的 三 角 齐 分 可 用 图 3-4 (b) 所 示 的 语法 树 表 示 。 该 语法 树 的 根 结 点 为 边 www。 三角 剂 
分 中 的 弦 组 成 其 余 的 内 结 点 。 多 边 形 中 除 wws 边 外 的 各 边 都 是 语法 树 的 一 个 叶 结 点 。 树 
根 vovs 是 三 角形 mvsavs 的 一 条 边 。 该 三 角形 将 原 多 边 形 分 为 三 个 部 分 : 三 角形 vovsve ;上册 
多 边 形 {w ,vi ，… ,vs} 和 凸 多 边 形 {v3 ,vs，… ,ve}。 三 角形 wwsvs 的 另外 两 条 边 , 即 弦 ww 
和 vsve 为 根 的 两 个 儿子 。 以 它们 为 根 的 子 树 表示 是 多边形 人 {vo yu ,… ,v3)} 和 {vs ,va，*… ,ve} 
的 三 角 训 分。 

在 一 般 情 况 下 , 凸 z 边 形 的 三 角 剖 分 对 应 于 一 棵 有 7 一 1 个 叶 结 点 的 语法 树 。 反 之 ,也 
可 根据 一 棵 及 一 1 个 叶 结 点 的 语法 树 产生 相应 的 凸 ” 边 形 的 三 角 放 分 。 也 就 是 说 , 凸 7 边 
形 的 三 角 剖 分 与 有 一 1 个 叶 结 点 的 语法 树 之 间 存 在 一 一 对 应 关系 。 由 于 个 矩阵 的 完全 
加 括号 乘积 与 n 个 叶 结 点 的 语法 树 之 间 存 在 一 一 对 应 关系 ,因此 ,n 个 矩阵 的 完全 加 括号 乘 
积 也 与 凸 (2 十 1) 边 形 中 的 三 角 剖 分 之 间 存 在 一 一 对 应 关系 。 图 3-4(a) 和 (b) 表 示 出 这 种 对 
应 关系 。 和 矩阵 连 乘 积 A14，…A， 中 的 每 个 矩阵 A; 对 应 于 凸 (z 十 1) 边 形 中 的 一 条 边 w-iwi。 
三 角 放 分 中 的 一 条 弦 wo ,zi<) 对 应 于 矩阵 连 乘 积 A[z 十 1: 门 。 

事实 上 ,和 矩阵 连 乘积 的 最 优 计算 次 序 问题 是 凸 多 边 形 最 优 三 角 剖 分 问题 的 特殊 情形 。 
对 于 给 定 的 矩阵 链 4;4;…4, ,定义 与 之 相应 的 凸 (z 十 1) 边 形 P= 二 {vw ,vi ，,…,v，} 使 得 矩阵 
4; 与 凸 多 边 形 的 边 wui 一 一 对 应 。 若 矩阵 4; 的 维 数 为 p;_1 Xpisi 王 1,2,…,n, 则 定义 三 
角形 vivjv 上 的 权 函 数值 为 : ww(Cuwoiob) 三 pipj;p:。 依 此 权 函 数 的 定义 , 凸 多 边 形 P 的 最 优 

= 角 训 分 所 对 应 的 语法 树 给 出 矩阵 链 A14。…A， 的 最 优 完全 加 括号 方式 。 

2. 最 优 子 结构 性 质 

凸 多 边 形 的 最 优 三 角 痢 分 问题 有 最 优 子 结构 性 质 。 

事实 上 , 若 凸 (2 十 1) 边 形 P={w ,mw,…,ww)} 的 最 优 三 角 剖 分 工 包含 三 角形 wwtu，1 扫 
As< 7 一 1, 则 了 的 权 为 三 个 部 分 权 的 和 : 三 角形 woviwv， 的 权 , 子 多 边 形 {w ou，…,w) 和 {w， 
to 的 权 之 和 。 可 以 断言 ,由 工 所 确定 的 这 两 个 子 多 边 形 的 三 角 痢 分 也 是 最 优 的 。 
因为 苦 有 {zo mw} 或 fuwyottl ww) 的 更 小 权 的 三 角 剖 分 将 导致 工 不 是 最 优 三 角 剂 
分 的 矛盾 。 

3. 最 优 三 角 章 分 的 递归 结构 

首先 ,定义 红 林 [ 门 ,1 委 i<7 和 2 为 凸 子 多 边 形 {uw-ivu ,的 最 优 三 角 前 分 所 对 应 
的 权 函 数值 , 即 其 最 优 值 。 为 方便 起 见 , 设 退 化 的 多 边 形 {v;-_1 ,vi}) 具 有 权 值 0。 据 此 定义 ， 
要 计算 的 凸 (n 十 1) 边 形 P 的 最 优 权 值 为 1[1j[n]。 

站 [7j 的 值 可 以 利用 最 优 子 结构 性 质 递归 地 计算 。 由 于 退化 的 2 顶点 多 边 形 的 权 值 
为 0, 所 以 z[ 让 [让 =0,i==1,2,…,n。 当 j 一 i 宇 1 时 , 凸 子 多 边 形 {v;-1,vi;,… ,vj) 至 少 有 3 个 
顶点 。 由 最 优 子 结构 性 质 ,t[ 避 [站 的 值 应 为 +[ 疏 [#j 的 值 加 上 z[k 十 1][ 门 的 值 ,再 加 上 三 角 
形 vi_1vrv; 的 权 值 ,其 中 ,i<k 达 j 一 1。 由 于 在 计算 时 还 不 知道 的 确切 位 置 ,而 的 所 有 
可 能 位 置 只 有 j 一 i 个 ,因此 ,可 以 在 这 j 一 i 个 位 置 中 选 出 使 i[ 疏 [ 门 值 达到 最 小 的 位 置 。 由 
此 ,t[ 刀 [ 门 可 递归 地 定义 为 

0 i=j 

世相 一 {sett 下 二 下 
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4. 计算 最 优 值 

与 矩阵 连 乘积 问题 中 计算 m[ 门 [站 ] 的 递归 式 进行 比较 ,容易 看 出 ,除了 权 函 数 的 定义 
外 ,t[ 刀 [站 与 wx[i[j] 的 递归 式 完全 一 样 。 因 此 ,只 要 对 计算 mw[ 疏 [ 门 的 算法 matrixChain 
进行 很 小 的 修改 就 完全 适用 于 计算 t[ 引 [jj]。 

下 面 描述 的 计算 凸 (2 十 1) 边 形 P 二 {vw ,wi,…,v,} 的 最 优 三 角 训 分 的 动态 规划 算法 
minWeightTriangulation 以 凸 多 边 形 P=={vo .wy,…,v,) 和 定义 在 三 角形 上 的 权 函 数 w 作 
为 输入 。 

public static void minWeightTriangulation(int n, int [J[] t, int [J[] s) 

{ 

for (int i=1; i<=n; i 十 十 ) t[iJ[i]=0; 
for (int r=2; r<=n; r 十 十 ) 
for (int i=1; i<=n—r+1; i 十 十 ) 
{ 
int j=i+r—1; 
t[i]JCj=t[i+1J0]+w(i—1,i,); 
s[LiJ0]=i; 
for (int k=i+1; k<i+r—1; k 十 十 ) 
{ 
int u=t[[kJ+t[k+1J0]+w(i—1,k,); 
if (u<t[i0]) 
{ 
t[i0]=u; 
s[iJ0]=k; 
} 
} 
} 

} 

与 算法 matrixChain 一 样 ,算法 minWeightTriangulation 占用 OG ) 空 间 , 耗 时 OG ) 。 

5. 构造 最 优 三 角 剂 分 

算法 minWeightTriangulation 在 计算 每 一 个 凸 子 多 边 形 {w;_1,v;,… ,vj) 的 最 优 值 时 ， 
用 数组 记录 了 最 优 三 角 剖 分 中 所 有 三 角形 信息 。s[ 让 [7 门 记 录 了 与 vi;-1 和 wj 一 起 构成 三 
角形 的 第 3 个 顶点 的 位 置 。 据 此 ,用 O(n) 时 间 就 可 构造 出 最 优 三 角 训 分 中 的 所 有 三 角形 。 


3.5 多边形 游戏 


多 边 形 游戏 是 一 个 单 人 玩 的 游戏 ,开始 时 有 一 个 由 个 顶点 构成 的 多 边 形 。 每 个 项 点 
被 赋予 一 个 整数 值 ,每 条 边 被 赋予 一 个 运算 符 十 或 * 。 所 有 边 依 次 用 整数 从 1 到 编号 。 

游戏 第 1 步 , 将 一 条 边 删 除 。 

随后 的 n 一 1 步 按 以 下 方式 操作 : 

(1) 选择 一 条 边 玉 以 及 由 EE 连接 着 的 两 个 顶点 Vi 和 V;。 


Vs 的 整数 值 通过 边 E 上 的 运算 得 到 的 结果 赋予 新 顶点。 
最 后 ,所 有 边 都 被 删除 ,游戏 结束 。 游 戏 的 得 分 就 是 所 剩 顶 点 上 的 整数 值 。 
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问题 :对 于 给 定 的 多 边 形 ,计算 最 高 得 分 。 

该 问题 与 上 一 节 中 讨论 过 的 凸 多 边 形 最 优 三 角 剖 分 问题 类 似 , 但 二 者 的 最 优 子 结构 性 
质 不 同 。 多 边 形 游戏 问题 的 最 优 子 结构 性 质 更 具有 一 般 性 。 

1. 最 优 子 结构 性 质 

设 所 给 的 多 边 形 的 顶点 和 边 的 顺 时 针 序 列 为 

op[1], v[1]，op[2], vL2], »…, op[Ln], vLn] 
其 中 ,op[ 门 表示 第 i 条 边 所 对 应 的 运算 符 ,v[ 门 表示 第 i 个 顶点 上 的 数值 ,i 二 1~n。 

在 所 给 多 边 形 中 ,从 顶点 i(1 志 i<n) 开 始 ,长 度 为 j( 链 中 有 j 个 顶点 ) 的 顺 时 针 链 p(i， 
门 可 表示 为 

v[ 记 , op[i 十 1],…, v[i 十 j 一 1] 

如 果 这 条 链 的 最 后 一 次 合并 运算 在 op[i 十 sj 处 发 生 (1 志 s 志 j 一 1), 则 可 在 op[i 十 sj] 处 将 
链 分 割 为 两 个 子 链 p(i,s) 和 p(i+s,j 一 s)。 

设 m 是 对 子 链 p(i,s) 的 任意 一 种 合并 方式 得 到 的 值 ,而 a 和 4 分 别 是 在 所 有 可 能 的 合 
并 中 得 到 的 最 小 值 和 最 大 值 。m; 是 p(i 十 s,j 一 s) 的 任意 一 种 合并 方式 得 到 的 值 ,而 c 和 d 
分 别 是 在 所 有 可 能 的 合并 中 得 到 的 最 小 值 和 最 大 值 。 依 此 定义 有 

a<m<b, c<m: <d 

由 于 子 链 p(i,s) 和 pli 十 s,j 一 s) 的 合并 方式 决定 了 站 在 op[i 十 sj 处 断 开 后 的 合并 

方式 ,在 op[i 十 sj 处 合并 后 其 值 为 
m = (m)op[it sj(m:) 

(1) 当 op[i 二 sj]=' 十 ' 时 ,显然 有 

a+c<m<<bt+d 

换 句 话说 ,由 链 p(i, 丫 合并 的 最 优 性 可 推出 子 链 pCi,s) 和 p(i 十 s,j 一 s) 的 最 优 性 , 且 最 
大 值 对 应 于 子 链 的 最 大 值 , 最 小 值 对 应 于 子 链 的 最 小 值 。 

(2) 当 op[i 十 sj 二 “x* “时 ,情况 有 所 不 同 。 由 于 v[ 门 可 取 负 整数 , 子 链 的 最 大 值 相 乘 未 
必 能 得 到 主 链 的 最 大 值 。 但 是 注意 到 最 大 值 一 定 在 边界 点 达到 , 即 

min{acvad ,bec,bd} mm maxlac,sad ,be ,bd} 

换 句 话说 , 主 链 的 最 大 值 和 最 小 值 可 由 子 链 的 最 大 值 和 最 小 值得 到 。 例 如 , 当 m= 二 ac 
时 ,最 大 主 链 由 它 的 两 条 最 小 子 链 组 成 ; 同 理 当 m= 二 bd 时 ,最 大 主 链 由 它 的 两 条 最 大 子 链 组 
成 。 无 论 哪 种 情形 发 生 , 由 主 链 的 最 优 性 均 可 推出 子 链 的 最 优 性 。 

综 上 可 知 多 边 形 游戏 问题 满足 最 优 子 结构 性 质 。 

2. 递归 求解 

由 前 面 的 分 析 可 知 ,为 了 求 链 合并 的 最 大 值 , 必 须 同 时 求 子 链 合并 的 最 大 值 和 最 小 值 。 
因此 ,在 整个 计算 过 程 中 ,应 同时 计算 最 大 值 和 最 小 值 。 

设 m[i,j,0j 是 链 p(i, 站 合并 的 最 小 值 ,而 m[i,j,1] 是 最 大 值 。 若 最 优 合并 在 op[i 十 sj] 
处 将 p(i, 站 分 为 两 个 长 度 小 于 j 的 子 链 p(isi 二 s) 和 p(i 十 s,j 一 s), 且 从 项 点 i 开始 的 长 度 
小 于 j 的 子 链 的 最 大 值 和 最 小 值 均 已 计算 出 。 为 叙述 方便 , 记 

a =m[Li,i+s,0] 
b= mLi,it+s,1] 
c= m[i+s,j—s,0] 
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d= m[iis,j—s,1] 
(1) 当 op[i 十 sj]= 十 “时 ， 
m[i,j,0] = a+te 
m[i,j,1] =6b+d 


(2) 当 op[i 十 s]== x* 时， 
m[i,j,0] = min{ac ,ad ,be ,bd)} 
m[i,j,1] = max{ac,ad ,bc ,bd} 
综合 (1) 和 (2) ,将 p(i, 店 在 op[i 十 sj 处 断 开 的 最 大 值 记 为 maxf(i,j,s), 最 小 值 记 为 
minfG js) , 则 


网 四 Q& 十 c op[i 十 sj] == “十” 
minf(i,j,s) 一 . 
min{ac,ad ,bc ,bd} op[Li 十 S] 一 * 

0 十 d op[i 二 sj] 二 十” 


f(i,j,s) 一 
A Ce op[i+s] =’*’ 


由 于 最 优 断 开 位 置 ;有 1<s<j 一 1 的 7 一 1 种 情况 ,由 此 可 知 
m[i,j,0] = Min {minfCi,j,s))} l1<i,j<n 
m[ij,1] = max{maxf{(i,j,s)} lisj<n 
初始 边界 值 显然 为 
m[i,1,0] = vw[] 1<i<n 
m[i,1,1] = v[] 1&<i<<n 
由 于 多 边 形 是 封闭 的 ,在 上 面 的 计算 中 , 当 ;is 盖头 时 ,顶点 i 十 s 实际 编号 为 (i 十 s) mod n。 
按 上 述 递 推 式 计 算出 的 mx[i,n,1j] 即 为 游戏 首次 删 去 第 i 条 边 后 得 到 的 最 大 得 分 。 
3. 算法 描述 
基于 以 上 讨论 可 设计 和 解 多 边 形 游戏 问题 的 动态 规划 算法 如 下 : 


Private static void minMax(int i, int s, int j) 
{ 
int [Je=new int [5]; 
int a=m[iJ[sj[0], 
b=m[iJ[LsJ[1], 
r 一 (i 十 s 一 1)%n 十 1， 
c 一 m[r]Uj 一 s][0]， 
d 一 m[rD 一 s][1]， 
if (op[r]=="t) 
{ 


minf 一 a 十 c; 


maxf 一 b 十 d; 
else 
{ 

e[L]1] 一 ax cs 


e[L2] 一 ax di 


动态 规划 


e[3]=bx cs 

e[L4] 王 bx ds 

minf 一 e[L1]; 

max{=e[1]; 

for (int k 一 2;k 一 5;k 十 十 ){ 
if (minf>e[k]) minf=e[k]; 
让 (max{<e[k]) max{=e[k]; 

} 

} 
} 


public static int polyMax() 
{ 
for (int j=2;j<=n;j 二 十 ) 
for (int i=1;i<=n;i++) 
for (int s 王 1;s 一 j;s 十 十 ){ 
minMax(i,s,)); 
if Cm[Li0IL0]> minf) m[iD]Lo]=minf; 
让 Cm[Li0IL1]<maxf) mLiC0IC1]= maxf; 
} 
int temp=m[1][n]j[1]; 
for (int i=2;i<=n;i+t+) 
if (temp<m[i[n][1]) temp=m[iJ[nj[1]; 
return temp; 


4 


4. 计算 复杂 性 分 析 
与 凸 多 边 形 最 优 三 角 痢 分 问题 类 似 , 上 述 算法 需要 OG ) 计 算 时 间 。 


3.6 图 像 压缩 


在 计算 机 中 常用 像素 点 灰 度 值 序列 {pi ,ps,…,p,) 表 示 图 像 。 其 中 ,整数 p;(1<i<n) 
表示 像素 点 i 的 灰 度 值 。 通 常 灰 度 值 的 范围 是 0~255。 因 此 ,需要 用 8 位 表示 一 个 像素 。 

图 像 的 变 位 压缩 存储 格式 将 所 给 的 像素 点 序列 {pi ,ps，…,p,) 分 割 成 m 个 连续 段 Si， 
Ss,，,…，,S,。 第 i 个 像素 段 S; 中 (1 入 i 生 wm) ,有 /[ 站 个 像素 , 且 该 段 中 每 个 像素 都 只 用 5[ 站 位 
表示 。 设 上 [站 二 NCkJ,1 之 i 过 m, 则 第 i 个 像素 段 S; 为 

Si = {pran Pg} l<i<m 

设 记 二 | log ( ,加 6p 十 1) 小 则 加 过 6[ 门 三 8。 因 此 需要 用 3 位 表示 6b[ 门 ， 
1 委 ;i 委 mm。 如 果 限 制 1 过 7[ 疏 二 255 , 则 需要 用 8 位 表示 ![ 让 ,1 志 i 二 mx。 因 此 ,第 i 个 像素 段 所 
需 的 存储 空间 为 1[i] x 5[ 让 ] 十 11 位 。 按 此 格式 存储 像素 序列 {pi, ps，…, ps}, 需要 


Si x6[ 订 十 llm 位 的 存储 空间 。 
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图 像 压 缩 问 题 要 求 确定 像素 序列 {pi ,ps，,…,p,}) 的 最 优 分 段 ,使 得 依 此 分 段 所 需 的 存 
储 空间 最 少 。 其 中 ,0 过 p; 二 256 ,1 过 in。 每 个 分 段 的 长 度 不 超过 256 位 。 


1. 最 优 子 结构 性 质 


设 l[ 让 ,b[i,1 二 i 全 m 是 {pi,ps，…, pr) 的 最 优 分 段 。 显 而 易 见 ,1[1],65b[L1] 是 
{pi1，…… piu) 的 最 优 分 段 , 且 !/[ 门 ,6[ 门 ,2 二 i<m 是 {pw ，…,p,) 的 最 优 分 段 。 即 图 像 压 


缩 问 题 满足 最 优 子 结构 性 质 。 
2. 递归 计算 最 优 值 


设 :[ 训 ,1 和 过 ”是 像素 序列 { 记 ,… ,pi;} 的 最 优 分 段 所 需 的 存储 位 数 。 由 最 优 子 结构 性 


质 易 知 


s[i] = min 
1<kSmin(i,256) 


其 中 ,bmax(Gi, 站 二 | log (max{p:}+1) |. 


{s[i—k]+kx*bmax(i 一 kk 十 1,i)} 十 11 


据 此 可 设计 解 图 像 压 缩 问 题 的 动态 规划 算法 如 下 : 


static final int lImax= 256; 
static final int header=11; 


static int my 


public static void compress(int p[], int s[], int I[], int b[]) 


{ 

int n=p. length 一 1; 

s[0]=0; 

for (int i=1; i<=n; i 十 十 ) 
b[i]=length(p[i]); 
int bmax=b[i]; 
s[i]=s[i—1]+bmax; 
l=1; 


for (int j=2; j<=i && j<=lmax; j 十 十 ) 


{ 


计 (bmax<b[i—j+1]) bmax=b[i—j+1]; 


让 (s[Li]>s[Li—j]+j* bmax) { 
s[]=s[i—j] 二 +j* bmax; 
l=j; 

} 

} 
s[i 二 =header; 


} 


Private static int length(int i) 
{ 

int k=1; 

i=i/2; 

while (i>0) 


动态 规划 


{ 
k 十 十 ; 
i=i/2; 
} 
return k; 


} 


3. 构造 最 优 解 

算法 compress 中 用 [让 和 6[ 让 记录 了 最 优 分 段 所 需 的 信息 。 最 优 分 段 的 最 后 一 段 的 
段 长 度 和 像素 位 数 分 别 存储 于 lL[nj 和 6b[n] 中 。 其 前 一 段 的 段 长 度 和 像素 位 数 存储 于 LL[n 一 
人 nj] 和 6[n 一 [nj] 中 。 依 次 类 推 ,由 算法 计算 出 的 1 和 6 可 在 O(n) 时 间 内 构造 出 相应 的 最 
优 解 。 具 体 算法 可 实现 如 下 : 


private static void traceback(int n, int s[], int I[]) 
{ 

让 (n==0) return; 

traceback(n—1[n],s,l); 

s[Lm 十 十 ] 王 n 一 ![n]; 
} 


public static void output(int s[], int I[],int b[]) 
{ 
int n 一 s. length 一 1; 
System. out. println("The optimal value is' 十 s[n])， 
m=0; 
traceback(n,s,]); 
s[m]=n; 
System. out. println("Decomposed into’+ m++"segments’) ; 
for (int j 王 1;j 一 一 mj;j 十 十 ) 
{ 
10]=1Ls0]]; 
b[j]=bLs[j]]; 
} 
for (int j=1;j<=m;j++) 
System. out. println(1[ 让 十 "十 bD]); 
} 
4. 计算 复杂 性 
算法 compress 显然 只 需 O(n) 空 间 。 由 于 算法 compress 中 对 j 的 循环 次 数 不 超 过 
256, 故 对 每 一 个 确定 的 i 可 在 O(1) 时 间 内 完成 __min [一 门 十 7 x bmax(i—j 二 +1,)} 


Sj<min(i,256 


的 计算 。 因 此 ,整个 算法 所 需 的 计算 时 间 为 O(n)。 


3.7 电路 布线 


在 一 块 电路 板 的 上 、 下 两 端 分 别 及 个 接线 柱 。 根 据 电 路 设计 ,要 求 用 导线 (i,x(i)) 将 
上 端 接 线 柱 i 与 下 端 接线 柱 x (i 让 相连 ,如 图 3-5 所 示 。 其 中 ,x( 让 ,1 三 i<n, 是 {1,2,…,n) 
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的 一 个 排列 。 导 线 (i,x(i)) 称 为 该 电路 板 上 的 第 i 条 连 线 。 对 于 任何 1 三 i<j 三 n, 第 i 条 连 
线 和 第 j 条 连 线 相交 的 充分 且 必 要 的 条 件 是 (iD 之 rG7) 。 


图 3-5 电路 布线 实例 


在 制作 电路 板 时 ,要 求 将 这 条 连 线 分 布 到 若干 个 绝缘 层 上 ,在 同一 层 上 的 连 线 不 相 
交 。 电 路 布线 问题 要 确定 将 哪些 连 线 安排 在 第 一 层 上 ,使 得 该 层 上 有 尽 可 能 多 的 连 线 。 换 
句 话说 ,该 问题 要 求 确定 导线 集 Nets=={(i,x( 店 ) ,1 过 i 过 n}) 的 最 大 不 相交 子 集 。 

1. 最 优 子 结构 性 质 

记 NG 站 一人 (tr(GO)ENets't<ir(0 入 ) 放 。NGJ) 的 最 大 不 相交 子 集 为 MNS(i,j)。 
Size(i,))=|MNS(i,))|。 

(1) 当 i=1 时 ， 


, 、 go j=x(1) 
MNS(1,) = N(1,)) = . 
(a j 宇 x(1) 
(2) 当 i>1 时 ， 
@ j=<x(i)。 此 时 ,(i,x(i)) FN(i,j)。 故 在 这 种 情况 下 , N(i,j) 二 NG(i 一 1, 站 ,从 而 
Size(i,j)= Size(i—1,j)。 
@ j 王 x(i)。 此 时 ,车 (i,x( 让 ) E MNS(i, 门 , 则 对 任意 (t,x(1))EMNS(i, 站 有 zi 
且 x() 过 x( 让 ;否则 , (t,x(z)) 与 (i,x(i)) 相 交 。 在 这 种 情况 下 MNS(i, 门 一 {(i,x(i))) 是 
N(i 一 1,x(i) 一 1) 的 最 大 不 相交 子 集 。 否 则 , 子 集 
MNSGi—1,x0)—1) U{(GrGD))) SC NGi,)) 
是 比 MNS(i,j) 更 大 的 N(i,j) 的 不 相交 子 集 。 这 与 MNS(i,j) 的 定义 相 矛 盾 。 
车 (i,x(i)) 钱 MNS(Gi, 站 , 则 对 任意 (x(t))EMNS(i, 站 ,有 t+ 二 i。 从 而 MNS(i, 门 导 
N(i 一 1,j)。 因 此 ,Size(i,j) 志 Size(i 一 1,j)。 
另 一 方面 ,MNS(i 一 1,))CN(i,j), 故 又 有 Size(i,j) 宇 Size(i 一 1,7), 从 而 Size(i,j)) 二 
Size(i 一 1.7)。 
综 上 可 知 , 电 路 布线 问题 满足 最 优 子 结构 性 质 。 
2. 递归 计算 最 优 值 
电路 布线 问题 的 最 优 值 为 Size(n,n)。 由 该 问题 的 最 优 子 结构 性 质 可 知 ; 
(1) 当 i=1 时 ， 
. 0 j<x() 
Size(1,7) = 
: j 宇 x(1) 
(27 当 21 时 ; 
Size(i—1,7) ji) 


Size(i,j) 一 Ce 。 » 
max{Size(i— 1,7),Size(i— 1,x(i) —1)+1)} j 宇 X02) 


据 此 可 设计 解 电 路 布线 问题 的 动态 
size[ 订 [表示 函数 Size(i,j) 的 值 。 


动态 规划 


规划 算法 mnset 如 下 。 其 中 ,用 二 维 数组 单元 


public static void mnset(int [ Jc, int [][]size) 


{ 
int n=c. length 一 1; 
for (int j=0; j=<c[1]; j 十 十 ) 
size[1][j]=0; 
for (int j=c[1]; j<=n; j++) 
size[1][j]=1; 
for (int i=2; i<n; i 十 十 ) 
* 
for (int j=0; j<c[i]; j 十 十 ) 
size[iJ[j]= size[i—1]J[)]; 
for (int j=c[i]; j<=n; j++) 
size[i][j]= Math. max(size[i—1] 
} 


size[nj[n]= Math. max(size[n 一 1][n]， 


上 


3. 构造 最 优 解 
根据 算法 mnset 计算 出 的 size [i 
MNS (n,n), 


public static int traceback(int [Jc, int [J[] 
{ 
int n 一 c. length 一 1; 
int j 一 nj; 
int m=0; 
for (int i=n; i 之 1; i 一 一 ) 
if (size[iJ0]! =size[i—1J0]) 
{ 
net[m 二 十 ]=i; 
j=di=1) 
i (j > 一 c[1]) 
net[m 十 十 ] 一 1; 
return m; 


; 


[j], size[i—1J[Cc[i]—1]+1); 


sizeLn—1]J[cLnj—1]+1); 


D] 值 ,容易 由 算法 traceback 构造 出 最 优 解 


size, int [Jnet) 


其 中 ,用 数组 net[0:m 一 1] 存 储 MNS(n,n) 中 的 m 条 连 线 。 


4. 计算 复杂 性 


算法 mnset 显然 需要 Ol ) 计 算 时 间 和 Olx?) 空 间 。 算 法 traceback 需要 O(n) 计 算 


时 间 。 
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3.8 流水 作业 调度 


nn 个 作业 {1,2,…,n} 要 在 由 两 台 机 器 MX 和 Ms 组 成 的 流水 线 上 完成 加 工 。 每 个 作业 加 
工 的 顺序 都 是 先 在 MX 上 加 工 , 然 后 在 M: 上 加 工 。M 和 Ms 加 工作 业 i 所 需 的 时 间 分 别 为 
a 和 bi,1 三 in。 流 水 作业 调度 问题 要 求 确定 这 个 作业 的 最 优 加 工 顺序 ,使 得 从 第 一 个 
作业 在 机 器 M 上 开始 加 工 , 到 最 后 一 个 作业 在 机 器 Ms 上 加 工 完 成 所 需 的 时 间 最 少 。 

直观 上 ,一 个 最 优 调度 应 使 机 器 M 没有 空闲 时 间 , 且 机 器 M: 的 空闲 时 间 最 少 。 在 一 
般 情况 下 ,机 器 Ms 上 会 有 机 器 空闲 和 作业 积压 两 种 情况 。 

设 全 部 作业 的 集合 为 N=={1,2,…,n}。SCN 是 NN 的 作业 子 集 。 在 一 般 情况 下 ,机 器 
Mi 开始 加 工 S 中 作业 时 ,机 器 M:* 还 在 加 工 其 他 作业 ,要 等 时 间 上 后 才 可 利用 。 将 这 种 情况 
下 完成 S 中 作业 所 需 的 最 短 时间 记 为 T(S,z)。 流 水 作业 调度 问题 的 最 优 值 为 TCN ,0)。 

1. 最 优 于 结构 性 质 

流水 作业 调度 问题 具有 最 优 子 结构 性 质 。 

设 t 是 所 给 个 流水 作业 的 一 个 最 优 调度 , 它 所 需 的 加 工时 间 为 ceb 十 T。 其 中 ,TT 
是 在 机 器 M; 的 等 待 时 间 为 wo 时 ,安排 作业 x(2),…,x(n) 所 需 的 时 间 。 

记 S=N 一 {x(1)}, 则 有 T=T(S,bwo)。 

事实 上 ,由 工 的 定义 知 T' 宇 T(S,bxw)。 若 全 二 T(S,brw), 设 x 是 作业 集 S 在 机 器 
M; 的 等 待 时 间 为 bo 情况 下 的 一 个 最 优 调度 。 则 x(1) ,x (2),… ,x (nn) 是 NN 的 一 个 调度 ， 
且 该 调度 所 需 的 时 间 为 as 十 T(S,brw ) 二 axw 十 T。 这 与 x 是 N 的 最 优 调度 矛盾 。 故 
TT(S,bw)。 从 而 T= 二 T(S,6bay)。 这 就 证 明了 流水 作业 调度 问题 具有 最 优 子 结构 的 
性 质 。 

2. 递归 计算 最 优 值 

由 流水 作业 调度 问题 的 最 优 子 结构 性 质 可 知 

TCN,0) = min{a: 十 TON 一 人 2)) 
推 到 一 般 情形 下 便 有 
T(S,2) = mintai + T(S— {2} , bi max{t — ai,0))} 
其 中 ,max{t 一 a;,0) 这 一 项 是 由 于 在 机 器 M, 上 ,作业 i 须 在 max{t,a;) 时 间 之 后 才能 开工 。 
因此 ,在 机 器 M1 上 完成 作业 i 之 后 ,在 机 器 上 还 需 
bi 二 max{tyai} —a; = b;+ max{t— ai,0} 

时 间 才 能 完成 对 作业 i 的 加 工 。 

按照 上 述 递 归 式 ,可 设计 出 解 流 水 作业 调度 问题 的 动态 规划 算法 。 但 是 ,对 递归 式 的 深 
入 分 析 表 明 ,算法 可 进一步 得 到 简化 。 

3. 流水 作业 调度 的 Johnson 法 则 

设 x 是 作业 集 S 在 机 器 M: 的 等 待 时 间 为 上 时 的 任 一 最 优 调 度 。 若 在 这 个 调度 中 ,安排 
在 最 前 面 的 两 个 作业 分 别 是 ; 和 7 , 即 x(1) 一 i,r(2) 一 )。 则 由 动态 规划 递归 式 可 得 

T(S,t) =a;++ T(S— {i},6 + max{t—ais0}) =a:ta;+t T(S— {i,j},t;) 

其 中 ， 


动态 规划 


tj; =b; + max{b; + max{t — ai,0}—a;j,0} 
=bjTbi—a;+max{max{t— ai,0},a;—b;} 
=bj;+bi—a;+ max{t— ai,a; — bi,0} 
=6bj 二 baja: Wha sai} 
如 果 作 业 i 和 j 满足 min{5;,aj) 宇 min{6; ,ai) , 则 称 作业 i 和 j 满足 Johnson 不 等 式 。 
如 果 作 业 i 和 jj 不 满足 Johnson 不 等 式 , 则 交换 作业 i 和 作业 j 的 加 工 顺序 后 ,作业 i 
和 j 满足 Johnson 不 等 式 。 
在 作业 集 S 当 机 器 M; 的 等 待 时 间 为 + 时 的 调度 x 中 ,交换 作业 i 和 作业 j 的 加 工 顺序 ， 
得 到 作业 集 S 的 另 一 调度 r“ , 它 所 需 的 加 工时 间 为 
TS = ait+a;+ TT(S— {i,j} ,ti) 


其 中 ， 
ti =b 二 bi—aj;—ait+max{ttya;ta; — b;,a;} 
当 作 业 i 和 j 满足 Johnson 不计 天 min{bi,aj) 宇 min{b; ,ai;) 时 ,有 
max{—bi, —aj} 委 max{—b;,—ai} 
从 而 
ait+a;+max{—bi, —a;} Cata;t+ max{—b;, —ai} 
由 此 可 得 
max{ai 十 中 一 ba SZ max{ait aj — b;,aj} 
因此 对 任意 上 ,有 
max{tdi ta;— bivsai} 委 max(t ai 十 0 一己 
从 而 ,ti 三 tj; 。 由 此 可 见 ,T(S,D)<T (S,t)。 

换 句 话说 , 当 作业 i 和 作业 j 不 满足 Johnson 不 等 式 时 ,交换 它们 的 加 工 顺序 后 ,作业 i 
和 j 满足 Johnson 不 等 式 , 且 不 增加 加 工时 间 。 由 此 可 知 , 对 于 流水 作业 调度 问题 , 必 存 在 
最 优 调 度 r, 使 得 作业 x(i) 和 x(i 十 1) 满 足 Johnson 不 等 式 

min{brw ,arctb } > min{brery rarcp } l1<i<n—1 
这 样 的 调度 x 称 为 满足 Johnson 法 则 的 调度 。 

进一步 还 可 以 证 明 ,调度 x 满足 Johnson 法 则 当 且 仅 当 对 任意 ;< 一) 有 

min{bep vaxp 之 min{be ,ar } 

由 此 可 知 ,任意 两 个 满足 Johnson 法 则 的 调度 具有 相同 的 加 工时 间 。 从 而 所 有 满足 
Johnson 法 则 的 调度 均 为 最 优 调 度 。 至 此 ,将 流水 作业 调度 问题 转化 为 求 满足 Johnson 法 
则 的 调度 问题 。 

4. 算法 描述 

从 上 面 的 分 析 可 知 , 流 水 作业 调度 问题 一 定 存在 满足 Johnson 法 则 的 最 优 调度 , 且 容 易 
由 下 面 的 算法 确定 。 

pi Mp 算法 如 下 : 

(1) 令 Ni= {ilai<b:} {ilai26:} 

(2) 将 N 中 作业 依 a; WE Na 中 作业 依 5; 的 非 增 序 排序 。 

(3) Ni 中 作业 接 N, 中 作业 构成 满足 Johnson 法 则 的 最 优 调度 。 

算法 可 具体 实现 如 下 : 


CD 
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public static int flowShop(int [Ja, int [Jb, int [Jc) 
{ 

int n=a. length; 

Element []d=new Element [n]; 


for (int i=0; i<n; i 十 +) 

{ 
int key=a[i]>b[i]?  b[i]:a[li]; 
boolean job=a[i]<=b[i]; 
d[i]=new Element(key,i,job); 

| 


MergeSort. mergeSort(d); 
int j=0, k=n—1; 
for (int i=0; i<n; i 十 十 ) 
{ 
if (d[i]. job) c[j++]=d[i]. index; 
else c[k—— ]=d[i]. index; 
} 
j=a[c[0]]; 
k=j+bLc[L0]]; 
for (int i=1; i<n; i 十 十 ) 
{ 
j+=a[c[i]]; 
k=j<k? k+bLe[Li]:j+bLe[i]]; 
} 
return k; 


: 
其 中 ,元 素 类 型 Element 说 明 为 


public static class Element implements Comparable 
{ 

int key; 

int index; 


boolean job; 


private Element(int kk, int ii, boolean jj) 


{ 


key=kk; 
index=ii; 
job 一 ji; 


public int compareTo(Object x) 
{ 


动态 规划 


int xkey 一 ((Element) x). key; 


让 (key 一 xkey) return—1; 3 
if (key== xkey) return 0; 章 
return 1; 


5. 计算 复杂 性 分 析 
算法 flowShop 的 主要 计算 时 间 花 在 对 作业 集 的 排序 。 因 此 ,在 最 坏 情况 下 算法 
flowShop 所 需 的 计算 时 间 为 O(nlogn) ,所 需 的 空间 显然 为 O(n) 。 


3.9 0-1 背包 问题 


0-1 背包 问题 ; 给 定 种 物品 和 一 背包 。 物品 ;的 重量 是 ww,, 其 价值 为 ,背包 的 容量 
为 C。 间 : 应 该 如 何 选择 装 入 背包 的 物品 ,使 得 装 入 背包 中 物品 的 总 价值 最 大 ? 

在 选择 装 和 背包 的 物品 时 ,对 每 种 物品 ; 只有 两 种 选择 , 即 装 入 背包 或 不 装 和 背包。 不 
能 将 物品 ; 装 人 背包 多 次 ,也 不 能 只 装 入 部 分 的 物品 i。 因 此 ,该 问题 称 为 0-1 背包 问题 。 

此 问题 的 形式 化 描述 是 ,给 定 Co,uw>0,w>0:1<i<m 要 求 找 出 元 0-1 向 量 (zi ， 
ZE 10,1),1<i<n, 使 得 oz 去 C, 而 且 》 wa 达到 最 大 。 因 此 ,0-1 背 包 问 
题 是 一 个 特殊 的 整数 规划 问题 。 


n 
max > ) wiz; 
i=1 


ed < 
TE {01}, li<n 

1. 最 优 子 结构 性 质 

0-1 背包 问题 具有 最 优 子 结构 性 质 。 设 (yi ,ys，…,y,) 是 所 给 0-1 背包 问题 的 一 个 最 
优 解 , 则 (ys，,…,y,) 是 下 面相 应 子 问 题 的 一 个 最 优 解 。 


i 
i=2 
2 <C— wy 
i=2 


Xi € {0,1}, 2<i<n 
因 若 不 然 , 设 (z,,…,z,) 是 上 述 子 问题 的 一 个 最 优 解 ,而 (ys,…,y,) 不 是 它 的 最 优 解 。 


由 此 可 知 , > )u; > wy 县 wiyi 十 Drs < 入 C. 因此， 


iy Dv > Dviys 
i=2 i=1 
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zol 十 py <C 
i=2 
这 说 明 (z ,xz,,…,z,) 是 所 给 0-1 背包 问题 的 更 优 解 ,从 而 (yi ,ys，…,y,) 不 是 所 给 0-1 背包 
问题 的 最 优 解 。 此 为 矛盾 。 
2. 递归 关系 
设 所 给 0-1 背包 问题 的 子 问题 


n 
max > UTh 
k=i 


> <j 

k=i 

ThE {0,1}, i<k<n 

的 最 优 值 为 m(i, 丫 , 即 m(i, 站 是 背包 容量 为 j, 可 选择 物品 为 i,i 十 1,…,n 时 0-1 背包 问题 
的 最 优 值 。 由 0-1 背包 问题 的 最 优 子 结构 性 质 ,可 以 建立 如 下 计算 mx(i, 站 的 递归 式 


by max{m(i+1,)) mCi 二 +1,jC— wi) 二 vi} 之 Wu 
m(i,j) 一 
od 0<j<=w 
Un ee 
m(n,j) = 
0 0<j<=w, 
3. 算法 描述 


基于 以 上 讨论 , 当 w;(1 志 i 过 n) 为 正 整数 时 ,用 二 维 数组 m[][] 存 储 xm(i,j) 的 相应 值 ， 
可 设计 解 0-1 背包 问题 的 动态 规划 算法 knapsack 如 下 : 


public static void knapsack(int []v，int [Jw, int cy int [J[Jm) 
{ 
int n=v. length—1; 
int JjMax= Math. min(w[n] 一 1,c); 
for (int j=0; j<=jMax; j 十 十 ) 
mLn][j] 一 0， 
for (int j 一 w[n]; j<=c¢; j 十 十 ) 
mLnJ[j]=v[Ln]; 


for (int i=n—1; i> 1; i 一 一 ) 
{ 
jMax= Math. minCw[ 口 一 1,c)， 
for (int j=0; j<=jMax; j 十 十 ) 
m[iD] 一 mLi 十 1]D]; 
for (int j=w[i]; j<=c; j++) 
m[ij[jj= Math. maxC(m[i+1j[0], m[i+1j0—wLi]]+v[i); 
} 
m[1J[cJ=m[L2jJ[Le]; 
让 (ce > 一 w[1]) 
m[1]J[c]=Math. max(m[1][c], mL[2][c 一 w[1]] 十 vL1])， 


动态 规划 


public static void traceback(int [J[ jm, int [Jw, int c, int [ x) 
{ 
int n=w. length 一 1; 
for (int i=1; i<n; i 十 十 ) 
if (m[iJ[c]==m[i+1]J[c])x[i]=0; 
else {x[i]=1; 
c—=w[i];} 
x[m] 一 (m[n][c]>0)? 1 : 0; 

按 上 述 算法 knapsack 计算 后 ,m[1j[cj 给 出 所 要 求 的 0-1 背包 问题 的 最 优 值 。 相 应 的 
最 优 解 可 由 算法 traceback 计算 如 下 : 

如 果 m[1J[dj 二 m[2j[dj, 则 z 二 0; 否 则 zi 二 1。 当 zz 二 0 时 ,由 m[2J[cj 继 续 构 造 最 
优 解 ; 当 zz 二 1 时 ,由 m[2][c 一 wj 继续 构造 最 优 解 。 以 此 类 推 ,可 构造 出 相应 的 最 优 解 
Ca va 

4. 计算 复杂 性 分 析 

从 计算 m(i, 丫 的 递归 式 容易 看 出 ,上 述 算法 knapsack 需要 O(nc) 计 算 时 间 , 而 算法 
traceback 需要 O(n) 计 算 时 间 。 

上 述 算法 knapsack 有 两 个 较 明 显 的 缺点 。 其 一 ,算法 要 求 所 给 物品 的 重量 rw(1 近 ;到 
) 是 整数 ;其 次 , 当 背 包容 量 c 很 大 时 ,算法 需要 的 计算 时 间 较 多 。 例 如 , 当 c>2" 时 ,算法 
knapsack 需要 Q(n2”) 计 算 时 间 。 

事实 上 ,注意 到 计算 m(i,j) 的 递归 式 在 变量 j 是 连续 变量 , 即 背包 容量 为 实数 时 仍 成 
立 , 可 以 采用 以 下 方法 克服 算法 knapsack 的 上 述 两 个 缺点 。 

首先 考查 0-1 背包 问题 的 一 个 具体 实例 如 下 : 

n=5,c= 10, w= {2,2,6,5,4}, v= {6,3,5,4,6} 
由 计算 m(i, 门 的 递归 式 , 当 i 二 5 时 ， 


6 j 宇 4 
0 0<j<4 

该 函数 是 关于 变量 j 的 阶梯 状 函 数 。 由 m(i, 丫 的 递归 式 容易 证 明 , 在 一 般 情况 下 ,对 
每 一 个 确定 的 i(1 志 i 二 nn) ,函数 m(i,7) 是 关于 变量 j 的 阶梯 状 单调 不 减 函数 。 跳 跃 点 是 这 
一 类 函数 的 描述 特征 。 如 函数 m(5, 站 可 由 其 两 个 跳跃 点 (0,0) 和 (4,6) 唯 一 确定 。 在 一 般 
情况 下 ,函数 m(i, 门 由 其 全 部 跳跃 点 唯一 确定 ,如 图 3-6 所 示 。 

在 变量 j 是 连续 变量 的 情况 下 ,可 以 对 每 一 个 确定 的 i(1 志 i<n) ,用 一 个 表 p[ 门 存储 函 
数 m(i, 站 的 全 部 跳跃 点 。 对 每 一 个 确定 的 实数 j, 可 以 通过 查找 表 p[ 疏 确定 函数 mx(i, 站 的 
值 。p[ 疏 中 全 部 跳跃 点 (j ,m(i,j)) 依 j 的 升序 排列 。 由 于 函数 m(i, 站 是 关于 变量 j 的 阶梯 
状 单 调 不 减 函数 , 故 p[ 疏 中 全 部 跳跃 点 的 m(i,j) 值 也 是 递增 排列 的 。 

表 p[ 门 可 依 计算 m(i, 站 的 递归 式 递 归 地 由 表 p[i 十 1 计算 ,初始 时 p[n 十 1] 二 {00， 
0))。 事 实 上 ,函数 m(i, 站 是 由 函数 mx(i 十 1,7) 与 函数 m(i 十 1,j 一 wi) 十 vi 做 max 运算 得 
到 的 。 因 此 ,函数 m(i,j) 的 全 部 跳跃 点 包含 于 函数 mw(i 十 1,7) 的 跳跃 点 集 p[i 十 1] 与 函数 
m(i 十 1,j 一 wi) 十 vi 的 跳跃 点 集 g[i 十 1j 的 并 集中 。 易 知 ,(s,t) Eg[i 十 1] 当 且 仅 当 w 志 s 坟 ec 


m(5,]) 一 | 
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m(i,)) 


| 


CM) 一 一 


图 3-6 


且 (s 一 wi,t 一 v;)€Ep[Li 十 1]。 因 
gq[Li+1j] = p[i+1]©® (w, 
另 一 方面 , 设 (a,5) 和 (ec， 


~ 


阶梯 状 单调 不 减 函 数 m(i, 站 及 其 跳跃 点 


此 ,容易 由 p[i 十 1] 确 定 跳跃 点 集 g[i 十 1] 如 下 : 
vi) = {G+wim(i)) to) | Gm(li,))) € pLit1]} 
d) 是 p[i 十 1] Ug[i 十 1] 中 的 两 个 跳跃 点 , 则 当 c 宇 a 


且 &<0 时 ,(c,d) 受 控 于 (ap), 从 而 (cd) 不 是 户 Ci 中 的 跳跃 点 。 除 受 控 跳跃 点 外 ， 
p[i 十 1]Ug[i 十 1 中 的 其 他 跳跃 点 均 为 p[ 疏 中 的 跳跃 点 。 由 此 可 见 , 在 递归 地 由 表 p[i 十 1] 
计算 表 p[ 门 时 ,可 先 由 p[i 二 1] 计算 出 g[i 十 志 , 然 后 合并 表 p[i 十 1] 和 表 g[i 十 1], 并 清除 其 


中 的 受 控 跳跃 点 得 到 表 p[ 门 。 


对 于 上 面 的 例子 ,初始 时 p[6] 二 {00,0)), (ws ,vs) 二 (4,6)。 因 此 ,g[6]=p[6] 人 名 


(ws vs) 二 {(4,6))}。 由 函数 ml 


5,7) 可 知 ,p[5j] 二 {(0,0),(4,6)}。 又 由 (ws,w) 二 (5,4) 


知 ,g[5j] 二 pL[5] 甸 Gwar ,ww) 二 {(5,4),(9,10)}。 从 跳跃 点 集 p[5] 与 gL[5j 的 并 集 p[5]Ug[L5j]= 


{C0,0),(4,6),(5,4),(9,10)} 
(5,4) 清除 后 ,得 到 p[4]=={(0， 
依 此 方式 递归 地 计算 出 


中 看 到 跳跃 点 (5,4) 受 控 于 跳跃 点 (4,6)。 将 受 控 跳跃 点 
0),(4,6),(9,10)), 从 而 得 到 函数 mm(4,j)。 


g[4] = p[4] BD (6,5) = {(6,5),(10,11)} 
p[L3] = {(0,0),(4,6),(9,10),(10,11)} 


gL3] = pL3] 4 


D (2,3) = {(2,3),(6,9)} 


pL2] = {(0,0),(2,3),(4,6),(6,9),C9,10),(C10,11)} 


gL2] = pL2] 4 


日 (2,6) = {(2,6),(4,9),(6,12),(8,15)} 


p[L1] = {(0,0),(2,6),(4,9),(6,12),(8,15)} 


p[1j 的 最 后 的 那个 跳跃 点 ( 
综 上 所 述 ,可 设计 解 0-1 背 


8.15) 给 出 所 求 的 最 优 值 为 m(1,c) 二 15。 
包 问 题 的 改进 的 动态 规划 算法 如 下 : 


public static double knapsack(double [Jw, double [J]v, double c，double [J[Jp,int [Jhead) 


{ 
int n=v. length—1; 
head[n+1]=0; 
p[0][0] 一 0; 
p[0][I] 一 0; 
int left 一 0， 
right 一 0， 


next 一 13 
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head[n]=1; 

for (int i=n;i>=1;i——){ 
int k= left; 
for (int j 王 left;j 二 一 right;j 十 十 ) 
长 


if (p[jj[0]+w[i> ce)break; 
double y= p[jj[0j+w[i], 
m=p[jj[1J+v[i]; 
while (k<= right && p[k][o] 一 y) 
{ 
p[nextj[0] 一 PLk][o]; 
p[next 十 十 ][1] 王 p[k 十 十 ][L1]， 
} 
if (k<=right && p[kJ[0]==y) 
《 
if (m<p[LkJ[1])m= pLk][1]; 
| 并) 
} 
if (m>p[next—1]J[1]) 
‘ 
pLnextJ[0]=y; 
pLnext++][1]=m; 
} 
while (k<=right && p[kJ[1]<= pLnext—1J[1])k+t+ ; 
} 
while (k=<= right) 
{ 
pLnextJL[0]=pLkJL0]; 
p[next 十 十 ][1] 一 pLk 十 十 ]L1]; 
} 
left 一 right 十 1; 
right 一 next 一 1; 
head[i—1]=next; 
} 
return p[next 一 1][1]; 


public static void traceback(double [ Jw,double [ Jv,double [J[Jp,int [Jhead,int [Jx) 
{ 

int n 一 w. length 一 1; 

double j= 王 pLhead[L0] 一 1][o]， 

m 一 pLhead[0] 一 1][1]; 
for (int i=1; i<=n; i 十 十 ) 
才 
x[i]=0; 
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for (int k 王 head[Li 十 1];k 一 =head[ 订 一 1;k 十 十 ) 
{ 
if (pL[kJ[0]+w[i]==j) &8& pL[kJ[1]+v[]==m) 
{ 
x[i]=1; 
j=p[kJ[L0]; 
m=p[kj[1]; 
break; 


} 


上 述 算法 的 主要 计算 量 在 于 计算 跳跃 点 集 p[ 门 (1 二 i<n)。 由 于 g[i 十 1]=p[i 二 1] 甸 
(wi ,vi) , 故 计算 gLi 十 1 需要 OC|p[i 十 1]|1) 计 算 时 间 。 合 并 p[i 十 1j 和 g[i 十 1j 并 清除 受 控 
跳跃 点 也 需要 O(|p[i 十 1]|) 计 算 时 间 。 从 跳跃 点 集 p[ 站 的 定义 可 以 看 出 ,p[ 疏 中 的 跳跃 点 
相应 于 xz;,… ,zs 的 0/1 赋值 。 因 此 ,zp[ 站 中 跳跃 点 个 数 不 超 过 2” 。 由 此 可 见 , 算 法 计算 
跳跃 点 集 p[ 门 (1 三 in) 所 花费 的 计算 时 间 为 


0(D 12ti+11)=0(P2")= 002" 
从 而 ,改进 后 算法 的 计算 时 间 复 杂 性 为 0(2")。 当 所 给 物品 的 重量 rw 是 整数 时 ,|p[ 让 | 过 
c 十 1, 其 中 ,1 三 i 二 n。 在 这 种 情况 下 ,改进 后 算法 的 计算 时 间 复 杂 性 为 OCmin{nc,2"}))。 


3.10 最 优 二 又 搜索 树 


设 S= {zi,zs，…,X,) 是 有 序 集 , 且 x 二 xs 二 … 二 x, ,表示 有 序 集 S 的 二 又 搜索 树 利用 
二 叉 树 的 结 点 存储 有 序 集 中 的 元 素 。 它 具有 下 述 性 质 : 存储 于 每 个 结 点 中 的 元 素 x 大 于 其 
左 子 树 中 任 一 结 点 所 存储 的 元 素 ,小 于 其 右 子 树 中 任 一 结 点 所 存储 的 元 素 。 二 叉 搜 索 树 的 
叶 结 点 是 形 如 (zi ,zit1) 的 开 区 间 。 在 表示 S 的 二 又 搜索 树 中 搜索 元 素 x, 返 回 的 结果 有 以 
下 两 种 情形 : 

(1) 在 二 又 搜 索 树 的 内 结 点 中 找到 z= 二 zx;。 

(2) 在 二 又 搜索 树 的 叶 结 点 中 确定 zxE (xi,zit1)。 

设 在 第 (1) 种 情形 中 找到 元 素 zx 一 zi 的 概率 为 5;; 在 第 (2) 种 情形 中 确定 zxE (zi,zitn) 
的 概率 为 a;。 其 中 ,约定 zo 王 一 ce,zn+l 一 十 cc。 显然 有 

ai 宇 0 0 和 
b; 宇 0 1<j<<n 


> 十 DE =1 
则 (ao ,2 ,ar sen sb, sa ) 称 为 集合 S 的 存 取 概率 分 布 。 
在 表示 S 的 二 叉 搜索 树 T 中 , 设 存储 元 素 zx; 的 结 点 深度 为 cj; 叶 结 点 (zi ,zjn) 的 结 点 


深度 为 dj, 则 p= Daa 十 中 十 Da 表示 在 二 又 搜索 树 T 中 进行 一 次 搜索 所 需要 的 平 
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均 比 较 次 数 。p 又 称 为 二 叉 搜 索 树 工 的 平均 路 长 。 在 一 般 情 形 下 ,不 同 的 二 叉 搜索 树 的 平 
均 路 长 是 不 相同 的 。 

最 优 二 又 搜索 树 问题 是 对 于 有 序 集 S 及 其 存 取 概率 分 布 (ao , ,aa ，…,b,,a,) ,在 所 有 
表示 有 序 集 S 的 二 又 搜 索 树 中 找 出 一 棵 具有 最 小 平均 路 长 的 二 又 搜索 树 。 

1. 最 优 子 结构 性 质 

二 叉 搜索 树 T 的 一 棵 含有 结 点 x;，,… ,x; 和 叶 结 点 (xii ,zi) ,…,(Zzj ,zj+t1) 的 子 树 可 以 
看 作 是 有 序 集 {x;,… ,xz } 关 于 全 集合 (zi-1，,… ,zj+1) 的 一 棵 二 又 搜 索 树 ,其 存 取 概率 为 下 面 
的 条 件 概 率 

bs = be/ wij i<k<j 
Ch = an /wij 一 二 半 轩 和 
其 中 »Wij =aii tbit tb; ta; ,1<i<j<n。 

设 T; 是 有 序 集 {x;,… ,zj} 关 于 存 取 概 率 (a;_1 ,6;,… ,6; ,aj) 的 一 棵 最 优 二 又 搜索 树 ,其 
平均 路 长 为 p;; 。T;j 的 根 结 点 存储 元 素 x,,。 其 左右 子 树 人 和 ,的 平均 路 长 分 别 为 p, 和 
pr。 由 于 T 和 T, 中 结 点 深度 是 它们 在 T5 中 的 结 点 深度 减 1, 故 有 

Wijhis = Wig TF Wid t wenspr 
由 于 TT 是 关于 集合 {zx;，,… ,zm-1) 的 一 棵 二 叉 搜 索 树 , 故 pi 三 pin-1。 若 pi 二 pin-1, 则 用 
Ti 替换 T, 可 得 到 平均 路 长 比 T; 更 小 的 二 叉 搜 索 树 。 这 与 T;; 是 最 优 二 又 搜索 树 矛 盾 。 
故 T, 是 一 棵 最 优 二 叉 搜 索 树 。 同 理 可 证 ,T, 也 是 一 棵 最 优 二 又 搜索 树 。 因 此 ,最 优 二 又 搜 
索 树 问题 具有 最 优 子 结构 性 质 。 

2. 递归 计算 最 优 值 

最 优 二 叉 搜索 树 Tu 的 平均 路 长 为 pi , 则 所 求 的 最 优 值 为 pi,,。 由 最 优 二 又 搜 索 树 问 
题 的 最 优 子 结构 性 质 可 建立 计算 加 的 递归 式 如 下 : 

Wwijpi; = wi 十 Bin {wo pi 十 wnsprs} i<j 

初始 时 , pi,i_1 二 0, 1i<n。 

记 wijpij 为 mi) 门 ; 则 mm(1,72) 二 tinp1wm 二 pi 为 所 求 的 最 优 值 。 

计算 m(i, 站 的 递归 式 为 

mlis)) = wot mintmlisk ol) +m(kt+ 1,7)} i<j 
m(i,si—1)=0 l<i<n 

据 此 ,可 设计 出 解 最 优 二 又 搜 索 树 问题 的 动态 规划 算法 optimalBinarySearchTree 
如 下 : 

public static void optimalBinarySearchTree(float [Ja, float [Jb, float [J[Jjm, int CJC]s, 

float [J[Jw) 
{ 

int n=a. length 一 1; 
for (int i=0; i<=n; i 十 十 ) 
{ 

w[it+1J[]=a[i]; 

m[i+1]J[i]=0; 
} 


CD 
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for (int r=0; r<n; r 十 十 ) 
for (int i=1; i<=n—r; i 十 十 ) 
{ 
int j 一 i 十 r; 
w[Li0]=wLi0—1]+al]+b[]; 
m[i[D] 一 mLi 十 1]Dj]; 
s[i0]=i; 
for (int k 一 i 十 1; k<=j; k 十 十 ){ 
float t=m[iJ[k—1]+m[k+1]0]; 
if Ct<m[iD]){ 
m[iD] 一 tt 
s[i0]=k;} 


} 
m[iJ0]+=w[i0]; 
} 
} 
3. 构造 最 优 解 


算法 optimalBinarySearchTree 中 用 s[ 引 [保存 最 优 子 树 TG 7 的 根 结 点 中 元 素 。 当 
s[1j[nj==k 时 ,zi 为 所 求 二 又 搜索 树 根 结 点 元 素 。 其 左 子 树 为 T(1,k 一 1)。 因 此 ,i 二 s[1] 
[4 一 1] 表 示 T(1,k 一 1) 的 根 结 点 元 素 为 x;。 依 此 类 推 ,容易 由 s 记录 的 信息 在 O(n) 时 间 内 
构造 出 所 求 的 最 优 二 又 搜索 树 。 

4. 计算 复杂 性 

算法 中 用 到 3 个 二 维 数组 m,s 和 ww, 故 所 需 的 空间 为 OCz2 ) 。 算 法 的 主要 计算 量 在 于 计 
算 in {mCik 一 1 十 m(k 十 1, 让 )。 对 于 固定 的 7, 它 需要 计算 时 间 OG 一 i 十 1D 一 Or 十 1)。 


因此 ,算法 所 耗费 的 总 时 间 为 > oo 1) = O(n)。 


事实 上 ,在 上 述 算法 中 ,可 以 证 明 
min{m(i,k— 1D)+m(k 二 +1,7)} = 
由 此 可 对 算法 做 进一步 改进 如 下 ， 


public static void obst(float [Ja, float [Jb, float [J[Jm, int CJC]s, float [CJC]w) 
{ 


{m(isk—1)++m(kt+1,7)} 


min 
si1J<k<si+1]0)] 


int n=a. length 一 1; 

for (int i=0; i<=n; i 十 十 ) 

{ 
wLit+1J[0i]=a[i]; 
m[i+1j[i]=0; 
s[i+1J[i]=0; 

} 

for (int r=0; r<n; r 十 十 ) 
for (int i=1; i<=n—r; i 十 十 ) 
{ 


int j 一 i 十 r， 
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i1=s[i]0—1]>i? sL]0—1]:i; 

j1=s[Lit+1J0]>i? sLit+1J0]:j; 
w[LiG]=wLi0—1]+aD]+b[]; 
m[iJ0]=m[i[i1—1]+m[il+1J0]; 
iGI=it; 


for (int k= 证 1; k<=jl; k 十 十 ) 
{ 
float t=m[iJ[k—1]+m[k+1J0]; 
if (t<=m[iJ[0]) 
{ 
m[iJ0]=t; 
s[iJ0]=k; 
} 
} 
m[iJ0]+=w[i]C0]; 


} 


改进 后 算法 obst 所 需 的 计算 时 间 为 0G) ,所 需 的 空间 为 O(n ) 。 
第 10 童 将 在 一 般 的 意义 下 证 明 上 述 改进 后 算法 obst 的 正确 性 。 


小 结 


本 章 以 矩阵 连 乘 问题 .最 长 公共 子 序列 . 凸 多 边 形 最 优 三 角 痢 分 多边形 游戏 ,图像 压 
缩 ` 电 路 布线 ,流水 作业 调度 .背包 问题 .最 优 二 叉 搜 索 树 等 具体 实例 ,详细 阐述 了 动态 规划 
算法 的 设计 思想 、 适 用 性 ,动态 规划 算法 的 基本 要 素 以 及 算法 的 设计 要 点 。 动 态 规划 算法 与 
分 治 法 类 似 ,其 基本 思想 也 是 将 待 求解 问题 分 解 成 若干 个 子 问题 , 先 求解 子 问 题 ,然后 从 这 
些 子 问题 的 解 得 到 原 问 题 的 解 。 与 分 治 法 不 同 的 是 ,动态 规划 法 用 一 个 表 来 记录 所 有 已 解 
决 的 子 问题 的 答案 。 不 管 该 子 问题 以 后 是 否 被 用 到 ,只 要 它 被 计算 过 ,就 将 其 结果 填 人 表 
中 。 在 需要 时 从 表 中 找 出 已 求 得 的 答案 ,避免 大 量 重复 计算 ,从 而 得 到 多 项 式 时 间 算 法 。 动 
态 规划 算法 的 具体 应 用 是 多 种 多 样 的 ,但 它们 具有 相同 的 填 表 格式 。 

动态 规划 算法 适用 于 解 最 优化 问题 。 通 常 按 以 下 几 个 步骤 设计 动态 规划 算法 : 四 找 出 
最 优 解 的 性 质 , 并 刻画 其 结构 特征 ; 四 递归 地 定义 最 优 值 ; 四 以 自 底 向 上 的 方式 计算 出 最 
优 值 ; 田 根据 计算 最 优 值 时 得 到 的 信息 构造 最 优 解 。 


习 题 


3-1 设计 一 个 Ol ) 时 间 的 算法 , 找 出 由 个 数组 成 的 序列 的 最 长 单调 递增 子 序列 。 

3-2 将 习题 3-1 中 算法 的 计算 时 间 减 至 O(nlogn)。( 提 示 : 一 个 长 度 为 i 的 候选 子 序列 的 
最 后 一 个 元 素 至 少 与 一 个 长 度 为 i 一 1 的 候选 子 序列 的 最 后 一 个 元 素 一 样 大 。 通 过 指 
向 输入 序列 中 元 素 的 指针 来 维持 候选 子 序列 ) 。 
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3-3 


3-4 


3-5 


3-6 


给 定 由 个 英文 单词 组 成 的 一 段 文 章 , 每 个 单词 的 长 度 (字符 个 数 ) 依 序 为 4 ,22 ，…， 
1。 要 在 一 台 打 印 机 上 将 这 段 文章 “漂亮 地 ”打印 出 来 。 打 印 机 每 行 最 多 可 打印 M 个 
字符 。 这 里 所 说 的 “漂亮 ”的 定义 如 下 : 在 打印 机 所 打印 的 每 一 行 中 , 行 首 和 行 尾 可 不 
留 空格 ; 行 中 每 两 个 单词 之 间 留 一 个 空格 ;如 果 在 一 行 中 打印 从 单词 i 到 单词 j 的 字 


符 , 则 按 打印 规则 ,应 在 一 行 中 恰好 打印 > 十 j 一 i 个 字符 (包括 字 间 空格 字符 ), 且 


不 允许 将 单词 打破 ;多 余 的 空格 数 为 M 一 j 十 i 一 六 0， 除 文章 的 最 后 一 行 外 ,希望 每 


行 多 余 的 空格 数 尽 可 能 少 。 因此 ,以 各 行 (最 后 一 行 除 外 ) 的 多 余 空格 数 的 立方 和 达到 
最 小 作为 “漂亮 ”的 标准 。 试 用 动态 规划 算法 设计 一 个 “漂亮 打印 ”方案 ,并 分 析 算 法 
的 计算 复杂 性 。 

考虑 下 面 的 整数 线性 规划 问题 : 


an 
max > )ciri 
1 一 1 


SS <b 
i=1 


zi 为 非 负 整 数 , 1 < i 过 n 

试 设计 一 个 解 此 问题 的 动态 规划 算法 ,并 分 析 算 法 的 计算 复杂 性 。 

给 定 妈 种 物品 和 一 背包 。 物 品 守 的 重量 是 zi, 体积 是 六 ,其 价值 为 ,背包 的 容量 为 
C ,容积 为 D。 问 : 应 该 如 何 选择 装 入 背包 中 的 物品 ,使 得 装 和 背包 中 物品 的 总 价值 最 
大 ? 在 选择 装 和 背包 的 物品 时 ,对 每 种 物品 只 有 两 种 选择 , 即 装 和 背包 或 不 装 人 背 
包 。 不 能 将 物品 i 装 入 背包 多 次 ,也 不 能 只 装 入 部 分 的 物品 i。 试 设计 一 个 解 此 问题 
的 动态 规划 算法 ,并 分 析 算 法 的 计算 复杂 性 。 

Ackerman 函数 A(m,n) 可 递归 地 定义 如 下 : 


证 十 计 12 一 0 
A(l(m.n) = ors 7 二 0 一 0 
Al(m—1,.A(m,.n— 1)) m>>0,n 二 0 
试 设计 一 个 计算 A(m,n) 的 动态 规划 算法 ,该 算法 只 占用 OGm) 空 间 。( 提 示 : 用 两 个 
数组 val[0:m]j 和 ind[0:xmmj, 使 得 对 任何 i 有 val[i]= 二 AGi,ind[i]))。 


当 一 个 问题 具有 最 优 子 结构 性 质 时 ,可 用 动态 规划 法 求解 。 但 有 时 会 有 更 简单 ,更 
有 效 的 算法 。 考 查找 硬币 的 例子 。 假 设 有 4 种 硬币 ,它们 的 面值 分 别 为 二 角 五 分 、 一 角 、 
五 分 和 一 分 。 现 在 要 找 给 某 顾客 六 角 三 分 钱 。 这 时 ,很 自然 会 拿 出 2 个 二 角 五 分 的 硬 
币 ,1 个 一 角 的 硬币 和 3 个 一 分 的 硬币 交 给 顾客 。 这 种 找 硬币 方法 与 其 他 的 找 法 相 比 ,所 
拿 出 的 硬币 个 数 是 最 少 的 。 事 实 上 ,这 里 用 到 下 面 的 找 硬币 算法 : 首先 选 出 1 个 面值 不 
超过 六 角 三 分 的 最 大 硬币 , 即 二 角 五 分 ,然后 从 六 角 三 分 中 减 去 二 角 五 分 , 剩 下 三 角 八 
分 。 再 选 出 1 个 面值 不 超过 三 角 八 分 的 最 大 硬币 , 即 又 一 个 二 角 五 分 ,如 此 一 直 做 下 去 。 
这 个 找 硬币 的 方法 实际 上 就 是 贪心 算法 。 顾 名 思 义 ,贪心 算法 总 是 做 出 在 当前 看 来 最 好 
的 选择 ,也 就 是 说 贪心 算法 并 不 从 整体 最 优 考 虑 , 它 所 做 出 的 选择 只 是 在 某 种 意义 上 的 
局 部 最 优选 择 。 当 然 ,希望 贪心 算法 得 到 的 最 终结 果 也 是 整体 最 优 的 。 上 面 所 说 的 找 硬 
币 算法 得 到 的 结果 是 整体 最 优 解 。 找 硬币 问题 本 身 具 有 最 优 子 结构 性 质 , 它 可 以 用 动态 
规划 算法 求解 。 但 用 贪心 算法 更 简单 更 直接 , 且 解 题 效 率 更 高 。 贪 心算 法 利用 了 问题 
本 身 的 一 些 特性 。 例 如 ,上 述 找 硬币 的 算法 利用 了 硬币 面值 的 特殊 性 。 如 果 硬 币 的 面值 
改 为 一 分 ,五 分 和 一 角 一 分 ,而 要 找 给 顾客 的 是 一 角 五 分 钱 。 还 用 贪心 算法 ,将 找 给 顾客 
1 个 一 角 一 分 的 硬币 和 4 个 一 分 的 硬币 。 然 而 3 个 五 分 的 硬币 显然 是 最 好 的 找 法 。 虽 然 
贪心 算法 不 能 对 所 有 问题 都 得 到 整体 最 优 解 ,但 是 对 许多 问题 它 能 产生 整体 最 优 解 。 例 
如 ,图 的 单 源 最 短路 径 问题 ,最 小 生成 树 问 题 等 。 在 一 些 情 况 下 ,即使 贪心 算法 不 能 得 到 
整体 最 优 解 ,其 最 终结 果 却 是 最 优 解 的 很 好 近似 。 


4.1 活动 安排 问题 


活动 安排 问题 是 可 以 用 贪心 算法 有 效 求解 的 很 好 的 例子 。 该 问题 要 求 高 效 地 安排 一 系 
列 争 用 某 一 公共 资源 的 活动 。 贪 心算 法 提供 了 一 个 简单 有效 的 方法 ,使 得 尽 可 能 多 的 活动 
能 兼容 地 使 用 公共 资源 。 

设 有 个 活动 的 集合 EE 二 {1,2,…,n) ,其 中 ,每 个 活动 都 要 求 使 用 同一 资源 ,如 演讲 会 
场 等 ,而 在 同一 时 间 内 只 有 一 个 活动 能 使 用 这 一 资源 。 每 个 活动 i 都 有 一 个 要 求 使 用 该 资 
源 的 起 始 时 间 s; 和 一 个 结束 时 间 fi, 且 s; 二 f:。 如 果 选 择 了 活动 i, 则 它 在 半 开 时 间 区 间 
[si, 方 ) 内 占用 资源 。 若 区 间 [ s;， i) 与 区 间 [s; ,fj;) 不 相交 , 则 称 活动 i 与 活动 j 是 相 容 
的 。 也 就 是 说 , 当 s; 三 fj; 或 5) 宇 fi 时 ,活动 i 与 活动 相 容 。 活动 安排 问题 就 是 要 在 所 给 的 


算法 设计 与 分 折 ( 艇 工 版 ) 


活动 集合 中 选 出 最 大 的 相 容 活动 子 集合 。 

在 下 面 所 给 出 的 解 活动 安排 问题 的 贪心 算法 greedySelector 中 ,各 活动 的 起 始 时 间 和 
结束 时 间 存 储 于 数组 * 和 了 中 且 按 结束 时 间 的 非 减 序 f1 声 f; 达 … 三 f 排列 。 如 果 所 给 出 
的 活动 未 按 此 序 排列 ,可 以 用 O(nlogn) 的 时 间 重 排 。 

public static int greedySelector(int [] s, int [] f，boolean [ 1a) 

{ 

int n=s. length 一 1; 
a[1]=true; 
int j 一 1; 
int count=1; 
for (int i=2;i<=n;it++) 
{ 
if (s[i]>={0)]) 
{ 
a[i]=true; 
j=i; 
count 十 十 ; 
LE 
else a[i]= false; 
} 
return count; 


} 


算法 greedySelector 用 集合 A 存储 所 选择 的 活动 。 活 动 i 在 集合 A 中 , 当 且 仅 当 A[ 门 
的 值 为 true。 变 量 j 用 以 记录 最 近 一 次 加 入 A 的 活动 。 由 于 输入 的 活动 按 其 结束 时 间 的 非 
减 序 排列 ,f; 总 是 当前 集合 A 中 所 有 活动 的 最 大 结束 时 间 , 即 

f= max{ f:} 

贪心 算法 greedySelector 一 开始 选择 活动 1, 并 将 j 初始 化 为 1。 然 后 依次 检查 活动 i 
是 否 与 当前 已 选择 的 所 有 活动 相 容 。 若 相 容 则 将 活动 i 加 入 已 选择 活动 的 集合 A 中 ;和 否则 ， 
不 选择 活动 i, 而 继续 检查 下 一 活动 与 集合 A 中 活动 的 相 容 性 。 由 于 f; 总 是 当前 集合 A 中 
所 有 活动 的 最 大 结束 时 间 , 故 活动 i 与 当前 集合 A 中 所 有 活动 相 容 的 充分 且 必 要 的 条 件 是 
其 开始 时 间 s; 不 早 于 最 近 加 入 集合 A 的 活动 j 的 结束 时 间 fj;, 即 s; 宇 f;。 若 活动 i 与 之 相 
容 , 则 i 成 为 最 近 加 入 集合 A 中 的 活动 ,并 取代 活动 的 位 置 。 由 于 输入 的 活动 以 其 完成 时 
间 的 非 减 序 排列 ,所 以 算法 greedySelector 每 次 总 是 选择 具有 最 早 完 成 时 间 的 相 容 活动 加 
入 集合 A 中 。 直 观 上 , 按 这 种 方法 选择 相 容 活动 为 未 安排 活动 留 下 尽 可 能 多 的 时 间 。 也 就 
是 说 ,该 算法 的 贪心 选择 的 意义 是 使 剩余 的 可 安排 时 间 段 极 大 化 ,以 便 安 排 尽 可 能 多 的 相 容 

算法 greedySelector 的 效率 极 高 。 当 输入 的 活动 已 按 结束 时 间 的 非 减 序 排列 ,算法 只 
需 90(7) 的 时 间 安 排 个 活动 ,使 最 多 的 活动 能 相 容 地 使 用 公共 资源 。 

例如 , 设 待 安排 的 11 个 活动 的 开始 时 间 和 结束 时 间 按 结束 时 间 的 非 减 序 排列 如 下 : 


i 1 2 3 4 5 6 和 8 3 10 Vy 
s[ 避 1 3 0 5 3 5 6 8 8 2 12 
f[] 4 5 6 党 8 $ 10 11 12 13 14 


算法 greedySelector 的 计算 过 程 如 图 4-1 所 示 。 


0123456789% 10 1 12 13 14 
图 4-1 算法 greedySelector 的 计算 过 程 


图 4-1 中 每 行 相应 于 算法 的 一 次 迭代 。 阴 影 长 条 表示 的 活动 是 已 选 入 集合 A 的 活动 ， 
而 空白 长 条 表示 的 活动 是 当前 正在 检查 相 容 性 的 活动 。 若 被 检查 的 活动 i 的 开始 时 间 s; 小 
于 最 近 选 择 的 活动 7 的 结束 时 间 方 , 则 不 选择 活动 i; 否则 选择 活动 i 加 入 集合 A 中 。 

贪心 算法 并 不 总 能 求 得 问题 的 整体 最 优 解 。 但 对 于 活动 安排 问题 ,贪心 算法 
greedySelector 却 总 能 求 得 的 整体 最 优 解 , 即 它 最 终 所 确定 的 相 容 活动 集合 A 的 规模 最 大 。 
这 个 结论 可 以 用 数学 归纳 法 证 明 。 

事实 上 , 设 E={1,2,…,n) 为 所 给 的 活动 集合 。 由 于 中 活动 按 结束 时 间 的 非 减 序 排 
列 , 故 活动 1 具有 最 早 的 完成 时 间 。 首 先 证 明 活动 安排 问题 有 一 个 最 优 解 以 贪心 选择 开始 ， 
即 该 最 优 解 中 包含 活动 1。 设 ACE 是 所 给 的 活动 安排 问题 的 一 个 最 优 解 , 且 A 中 活动 也 
按 结束 时 间 非 减 序 排列 ,A 中 的 第 一 个 活动 是 活动 £。 若 二 1, 则 A 就 是 以 贪心 选择 开始 
的 最 优 解 ; 若 1, 则 设 B 二 A 一 {&}U1{1}。 由 于 下 夺 所, 且 A 中 活动 是 相 容 的 , 故 B 中 的 
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活动 也 是 相 容 的 。 又 由 于 B 中 活动 个 数 与 A 中 活动 个 数 相同 , 且 A 是 最 优 的 , 故 B 也 是 最 
优 的。 也 就 是 说 B 是 以 贪心 选择 活动 1 开始 的 最 优 活动 安排 。 由 此 可 见 , 总 存在 以 贪心 选 
择 开始 的 最 优 活动 安排 方案 。 

进一步 ,在 做 出 了 贪心 选择 , 即 选 择 了 活动 1 后 , 原 问题 简化 为 对 EE 中 所 有 与 活动 1 相 
容 的 活动 进行 活动 安排 的 子 问题 。 也 就 是 说 ,车 A 是 原 问 题 的 最 优 解 , 则 A’ 二 A 一 {1} 是 活 
动 安排 问题 E 二 (iEE:s; 宇 fi) 的 最 优 解 。 事实 上 ,如 果 能 找到 已 ' 的 一 个 解 B', 它 包含 比 
A' 更 多 的 活动 , 则 将 活动 1 加 入 B' 中 将 产生 EE 的 一 个 解 B, 它 包含 比 A 更 多 的 活动 。 这 与 
A 的 最 优 性 矛盾 。 因 此 ,每 一 步 所 做 出 的 贪心 选择 都 将 问题 简化 为 一 个 更 小 的 与 原 问题 具 
有 相同 形式 的 子 问题 。 对 贪心 选择 次 数 用 数学 归纳 法 即 知 ,贪心 算法 greedySelector 最 终 
产生 原 问 题 的 最 优 解 。 


4.2 ”贪心 算法 的 基本 要 素 


贪心 算法 通过 一 系列 的 选择 得 到 问题 的 解 。 它 所 做 出 的 每 一 个 选择 都 是 当前 状态 下 局 
部 最 好 选择 , 即 贪心 选择 。 这 种 启发 式 的 策略 并 不 总 能 获得 最 优 解 ,然而 在 许多 情况 下 确 能 
达到 预期 目的 。 活 动 安排 问题 的 贪心 算法 就 是 一 个 例子 。 下 面 着 重 讨论 可 以 用 贪心 算法 求 
解 的 问题 的 一 般 特征 。 

对 于 一 个 具体 的 问题 ,怎么 知道 是 否 可 用 贪心 算法 解 此 问题 ,以 及 能 否 得 到 问题 的 最 优 
解 呢 ? 这 个 问题 很 难 给 予 肯定 的 回答 。 但 是 ,从 许多 可 以 用 贪心 算法 求解 的 问题 中 看 到 这 
类 问题 一 般 具 有 两 个 重要 的 性 质 : 贪心 选择 性 质 和 最 优 子 结构 性 质 。 


4.2.1 贪心 选择 性 质 


所 谓 贪心 选择 性 质 是 指 所 求 问题 的 整体 最 优 解 可 以 通过 一 系列 局 部 最 优 的 选择 , 即 贪 
心 选 择 来 达到 。 这 是 贪心 算法 可 行 的 第 一 个 基本 要 素 , 也 是 贪心 算法 与 动态 规划 算法 的 主 
要 区 别 。 在 动态 规划 算法 中 ,每 步 所 做 出 的 选择 往往 依赖 于 相关 子 问题 的 解 。 因 而 上 只 有 在 
解 出 相关 子 问题 后 ,才能 做 出 选择 。 而 在 贪心 算法 中 , 仅 在 当前 状态 下 做 出 最 好 选择 , 即 局 
部 最 优选 择 。 然 后 再 去 解 做 出 这 个 选择 后 产生 的 相应 的 子 问题 。 贪 心算 法 所 做 出 的 贪心 选 
择 可 以 依赖 于 以 往 所 做 过 的 选择 ,但 绝 不 依赖 于 将 来 所 做 的 选择 ,也 不 依赖 于 子 问题 的 解 。 
正 是 由 于 这 种 差别 ,动态 规划 算法 通常 以 自 底 向 上 的 方式 解 各 子 问题 ,而 贪心 算法 则 通常 以 
自 项 向 下 的 方式 进行 ,以 迭代 的 方式 做 出 相继 的 贪心 选择 ,每 做 出 一 次 贪心 选择 就 将 所 求 问 
题 简化 为 规模 更 小 的 子 问 题 。 

对 于 一 个 具体 问题 .要 确定 它 是 否 具 有 贪心 选择 性 质 , 必 须 证 明 每 一 步 所 做 出 的 贪心 选 
择 最 终 导致 问题 的 整体 最 优 解 。 通 常 可 以 用 类 似 于 证 明 活动 安排 问题 的 贪心 选择 性 质 时 所 
采用 的 方法 来 证 明 。 首 先 考 查 问题 的 一 个 整体 最 优 解 ,并 证 明 可 修改 这 个 最 优 解 ,使 其 以 贪 
心 选择 开始 。 做 出 贪心 选择 后 , 原 问 题 简化 为 规模 更 小 的 类 似 子 问 题 。 然 后 ,用 数学 归纳 法 
证 明 , 通 过 每 一 步 做 贪心 选择 ,最 终 可 得 到 问题 的 整体 最 优 解 。 其 中 ,证 明 贪 心 选择 后 的 问 
题 简化 为 规模 更 小 的 类 似 子 问题 的 关键 在 于 利用 该 问题 的 最 优 子 结构 性 质 。 


4.2.2 最 优 子 结构 性 质 


当 一 个 问题 的 最 优 解 包 含 其 子 问题 的 最 优 解 时 , 称 此 问题 具有 最 优 子 结构 性 质 。 问 题 
的 最 优 子 结构 性 质 是 该 问题 可 用 动态 规划 算法 或 贪心 算法 求解 的 关键 特征 。 在 活动 安排 问 
题 中 ,其 最 优 子 结构 性 质 表现 为 : 若 A 是 关于 下 的 活动 安排 问题 的 包含 活动 1 的 一 个 最 优 
解 , 则 相 容 活动 集合 A’ 二 A 一 {1} 是 关于 E' 二 {iEE:s; 宇 有 i) 的 活动 安排 问题 的 一 个 最 优 解 。 


4.2.3 贪心 算法 与 动态 规划 算法 的 差异 


贪心 算法 和 动态 规划 算法 都 要 求 问题 具有 最 优 子 结构 性 质 ,这 是 两 类 算法 的 一 个 共同 
点 。 但 是 ,对 于 具有 最 优 子 结构 的 问题 应 该 选用 贪心 算法 还 是 动态 规划 算法 求解 ? 是 否 能 
用 动态 规划 算法 求解 的 问题 也 能 用 贪心 算法 求解 ? 下 面 研究 两 个 经 典 的 组 合 优化 问题 ,并 
以 此 说 明 贪 心算 法 与 动态 规划 算法 的 主要 差别 。 

1. 0-1 背包 问题 与 背包 问题 

0-1 背包 问题 : 给 定 n 种 物品 和 一 个 背包 。 物 品 i 的 重量 是 w; ,其 价值 为 w ,背包 的 容 
量 为 C。 应 如 何 选择 装 入 背包 的 物品 ,使 得 装 入 背包 中 物品 的 总 价值 最 大 ? 

在 选择 装 人 背包 的 物品 时 ,对 每 种 物品 只 有 两 种 选择 , 即 装 人 背包 或 不 装 人 背包 。 不 
能 将 物品 i 装 入 背包 多 次 ,也 不 能 只 装 入 部 分 的 物品 i。 

此 问题 的 形式 化 描述 是 ,给 定 C>0,rzw 二 0,uw 二 0,1 近 ji 迄 2 要求 找 出 一 个 交 元 0-1 向 量 
(x1,T2 Tn) ,XiE (0,1} ,1 委 i 魏 2, 使 得 Dur <e, 而 且 了 wnt3 达到 最 大 。 


i=1 


背包 问题 : 与 0-1 背包 问题 类 似 ， 所 不 同 的 是 在 选择 物品 i 装 和 背包 时 ,可 以 选择 物品 
i 的 一 部 分 ,而 不 一 定 要 全 部 装 和 背包 ,1<i<n。 
此 问题 的 形式 化 描述 是 ,给 定 C 二 0,w; 记 0,vi 记 0,1 达 i 过 n, 要 求 找 出 一 个 元 向 量 


(zz ) 0Xi 二 1,1 二 i<n, 使 得 Dr <C, 而 且 wa， 达到 最 大 。 


2 贪心 算法 与 动态 规划 算法 的 主要 差别 

0-1 背包 问题 与 背包 问题 这 两 类 问题 都 具有 最 优 子 结构 性 质 。 对 于 0-1 背包 问题 , 设 
A 是 能 够 装 入 容量 为 C 的 背包 的 具有 最 大 价值 的 物品 集合 , 则 A; 二 A 一 {说 是 n 一 1 个 物品 
1,2,…,j 一 1,j 十 1,…,n 可 装 入 容量 为 C 一 w; 的 背包 的 具有 最 大 价值 的 物品 集合 。 对 于 背 
包 问 题 ,类似 地 , 若 它 的 一 个 最 优 解 包含 物品 j, 则 从 该 最 优 解 中 拿 出 所 含 的 物品 j 的 那 部 
分 重量 zw ,剩余 的 将 是 n 一 1 个 原 重 物品 1,2,…,j 一 1,j 十 1,…,n 以 及 重 为 wj 一 w 的 物品 j 
中 可 装 入 容量 为 C 一 w 的 背包 且 具 有 最 大 价值 的 物品 。 

虽然 这 两 个 问题 极为 相似 ,但 背包 问题 可 以 用 贪心 算法 求解 ,而 0-1 背包 问题 却 不 能 用 
贪心 算法 求解 。 用 贪心 算法 解 背包 问题 的 基本 步骤 是 ,首先 计算 每 种 物品 单位 重量 的 价值 
vi/aui ,然后 依 贪心 选择 策略 ,将 尽 可 能 多 的 单位 重量 价值 最 大 的 物品 装 人 背包 。 若 将 这 种 
物品 全 部 装 和 人 背包 后 ,背包 内 的 物品 总 重量 未 超过 C, 则 选择 单位 重量 价值 次 高 的 物品 并 尽 
可 能 多 地 装 入 背包 。 依 此 策略 一 直 地 做 下 去 ,直到 背包 装 满 为 止 。 具 体 算法 可 描述 如 下 : 


public static float knapsack(float c,float [] w, float [] v,float [] x) 
{ 


和 和 
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int n 一 v. length; 

Element [] d=new Element [n]; 

for (int i=0; i<n; i 十 十 ) 
d[i]=new Element(w[i] ,v[i] ,i); 

MergeSort. mergeSort(d); 

int i; 

float opt=0; 

for (i=0;i<n;it+) x[i]=0; 

for (i=0;i<n;it++) 

{ 
if (d[i]. w>e) break; 
x[d[i].]=1; 
opt+=d[i].v; 
c—=d[i.w; 

} 

if (i<n) 

{ 
x[d[i].i]=c/d[i]. w; 
opt+=x[d[i].i] * d[i.v; 

} 

return opt; 


} 


算法 knapsack 的 主要 计算 时 间 在 于 将 各 种 物品 依 其 单位 重量 的 价值 从 大 到 小 排序 。 
因此 ,算法 的 计算 时 间 上 界 为 O(nlogn)。 当 然 ,为 了 证 明 算法 的 正确 性 ,还 必须 证 明 背 包 问 
题 具 有 贪心 选择 性 质 。 

这 种 贪心 选择 策略 对 0-1 背包 问题 就 不 适用 了 。 看 图 4-2 中 的 例子 ,其 中 有 3 种 物品 ， 
背包 的 容量 为 50 公斤 。 物品 1 重 10 公斤 ,价值 60 元 ;物品 2 重 20 公斤 ,价值 100 元 ;物品 
3 重 30 公斤 ,价值 120 元 。 因 此 ,物品 1 每 公斤 价值 6 元 ,物品 2 每 公斤 价值 5 元 ,物品 3 每 
公斤 价值 4 元 。 若 依 贪心 选择 策略 ,应 首选 物品 1 装 入 背包 ,然而 从 图 4-2(b) 的 各 种 情况 
可 以 看 出 ,最 优 的 选择 方案 是 选择 物品 2 和 物品 3 装 和 人 背包。 首选 物品 1 的 2 种 方案 都 不 
是 最 优 的 。 对 于 背包 问题 ,贪心 选择 最 终 可 得 到 最 优 解 , 其 选择 方案 如 图 4-2(c) 所 示 。 


背包 

20| 80 

3 30| 120 六 

30| 120 

2 名 | + |zolioo 20| 100 

1 |2o| 2 20| 100 + + 
10 10| 60 |10| 60 10| 60 
¥60 ¥100 ¥120 =¥220 =¥160 =¥180 =¥240 

(a (b) (9) 


图 4-2 0-1 背包 问题 的 例子 


对 于 0-1 背包 问题 ,贪心 选择 之 所 以 不 能 得 到 最 优 解 ,是 因为 在 这 种 情况 下 它 无 法 保证 
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最 终 能 将 背包 装 满 ,部 分 闲置 的 背包 空间 使 每 公斤 背包 空间 的 价值 降低 了 。 事 实 上 ,在 考虑 
0-1 背包 问题 时 ,应 比较 选择 该 物品 和 不 选择 该 物品 所 导致 的 最 终 方案 ,然后 再 做 出 最 好 选 
择 。 由 此 就 导出 许多 互相 重 麦 的 子 问题 。 这 正 是 该 问题 可 用 动态 规划 算法 求解 的 另 一 重要 
特征 。 实 际 上 也 是 如 此 ,动态 规划 算法 的 确 可 以 有 效 地 解 0-1 背包 问题 。 


4.3 最 优 装 载 


有 一 批 集装箱 要 装 上 一 稻 载 重量 为 c 的 轮船 。 其 中 集装箱 i 的 重量 为 w;。 最 优 装 载 问 
题 要 求 确定 在 装载 体积 不 受 限 制 的 情况 下 ,将 尽 可 能 多 的 集装箱 装 上 轮船 。 
该 问题 可 形式 化 描述 为 


, 
ne 
i=1 


n 
2 wri Se 
i 


EE {0 ET 有 二 和 
其 中 ,变量 x; 二 0 表示 不 装 人 集装箱 i, xz; 二 1 表示 装 人 集装箱 i。 
1. 算法 描述 
最 优 装载 问题 可 用 贪心 算法 求解 。 采 用 重量 最 轻 者 先 装 的 贪心 选择 策略 ,可 产生 最 优 
装载 问题 的 最 优 解 。 具 体 算法 描述 如 下 : 


public static float loading(float c, float [] w, int [] x) 
{ 
int n= w. length; 
Element [] d=new Element [n]; 
for (int i=0; i<n; i 十 十 ) 
d[i]=new Element(w[i] ,i); 
MergeSort. mergeSort(d); 
float opt=0; 
for (int i=0; i<n; i 十 十 ) x[i]=0; 
for (int i=0; i<n && d[i].w <=c; i 十 十 ) 
{ 
x[d[i].i]=1; 
opt+=d[i.w; 
c—=d[i]. w; 
} 
return opt; 


} 
其 中 ,Element 类 说 明 如 下 : 


public static class Element implements Comparable 
{ 
float ws; 


int i; 
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public Element(float ww, int ii) 


public int compareTo(Object x) 
{ 
float xw= ((Element) x). w; 
if (wxw) return—1; 
if (w== xw) return 0; 


return 1; 


} 


2. 贪心 选择 性 质 

设 集装箱 已 依 其 重量 从 小 到 大 排序 , (zi ,zs，… ,zx,) 是 最 优 装 载 问 题 的 一 个 最 优 解 。 又 
设 k= min (ilz:=1}。 易 知 ,如 果 给 定 的 最 优 装 载 问 题 有 解 , 则 1<k<n。 

(1) 当 &=1 时 , (zi ,zo，… ,x,) 是 一 个 满足 贪心 选择 性 质 的 最 优 解 。 

(2) 当 这 1 时, 取 和 =1,y4= 二 0,y;= 二 xis,1 达 i 二 n,i 关 k, 则 


pe 三 wi 一 wi 十 二 二 < pa du 
i=1 i=1 i=l 
因此 ,(y ,ys，…,y,) 是 所 给 最 优 装 载 问题 的 可 行 解 。 


另 一 方面 , 由 >)w = zz 知 ,Cy ,ys，…,y,) 是 满足 贪心 选择 性 质 的 最 优 解 。 


所 以 ,最 优 装载 问题 具有 贪心 选择 性 质 。 

3. 最 优 子 结构 性 质 

设 (zi,zz,…,znw) 是 最 优 装载 问题 的 满足 贪心 选择 性 质 的 最 优 和 解 , 则 容易 知道 ,zi 一 1， 
且 (za，…zw) 是 轮船 载重 量 为 c 一 zw , 待 装 船 集装箱 为 1{2,3,…:z} 时 相应 最 优 装 载 问题 的 
最 优 解 。 也 就 是 说 ,最 优 装 载 问题 具有 最 优 子 结构 性 质 。 

由 最 优 装载 问题 的 贪心 选择 性 质 和 最 优 子 结构 性 质 , 容 易 证 明 算法 loading 的 正确 性 。 

算法 loading 的 主要 计算 量 在 于 将 集装箱 依 其 重量 从 小 到 大 排序 , 故 算法 所 需 的 计算 
时 间 为 O(nlogn)。 


4.4 哈 夫 曼 编 码 


哈 夫 曼 编码 是 广泛 地 用 于 数据 文件 压缩 的 十 分 有 效 的 编码 方法 。 其 压缩 率 通 常 在 
20% 一 90% 之 间 。 哈 夫 曼 编码 算法 用 字符 在 文件 中 出 现 的 频率 表 来 建立 一 个 用 0,1 串 表 示 
各 字符 的 最 优 表示 方式 。 假 设 有 一 个 数据 文件 包含 100 000 个 字符 ,要 用 压缩 的 方式 存储 
它 。 该 文件 中 各 字符 出 现 的 频率 如 表 4-1 所 示 。 文 件 中 共有 6 个 不 同 字符 出 现 。 字 符 a 出 
现 45 000 次 ,字符 b 出 现 13 000 次 等 。 


表 4-1 字符 出 现 的 频率 表 


字 符 a b c d e 
频率 ( 千 次 ) 45 13 12 16 9 5 

定 长 码 000 001 010 011 100 101 

变 长 码 0 101 100 111 1101 1100 


有 多 种 方法 表示 文件 中 的 信息 。 考 查 用 0,1 码 串 表示 字符 的 方法 , 即 每 个 字符 用 唯一 
的 0,1 串 表 示 。 若 使 用 定 长 码 , 则 表示 6 个 不 同 的 字符 需要 3 位 : a 王 000,b 王 001,…,{f 一 
101。 用 这 种 方法 对 整个 文件 进行 编码 需要 300 000 位 。 能 否 做 得 更 好 些 呢 ? 使 用 变 长 码 
要 比 使 用 定 长 码 好 得 多 。 给 出 现 频率 高 的 字符 较 短 的 编码 ,出 现 频率 较 低 的 字符 以 较 长 的 
编码 ,可 以 大 大 缩短 总 码 长 。 表 4-1 给 出 了 一 种 变 长 码 编码 方案 。 其 中 ,字符 a 用 1 位 串 0 
表示 ,而 字符 {用 4 位 串 1100 表示 。 用 这 种 编码 方案 ,整个 文件 的 总 码 长 为 : (45X1 十 13X 
3 十 12X3 十 16X3 十 9X4 十 5X4)X1000 一 224 000 位 。 它 比 用 定 长 码 方案 好 ,总 码 长 减少 约 
25%。 事 实 上 ,这 是 该 文件 的 最 优 编码 方案 。 


4.4.1 前 级 码 


对 每 一 个 字符 规定 一 个 0,1 串 作 为 其 代码 ,并 要 求 任 一 字符 的 代码 都 不 是 其 他 字符 代 
码 的 前 级 ,这 种 编码 称 为 前 级 码 ,编码 的 前 缀 性 质 可 以 使 译 码 方 法 非常 简单 。 由 于 任 一 字符 
的 代码 都 不 是 其 他 字符 代码 的 前 级 ,从 编码 文件 中 不 断 取出 代表 某 一 字符 的 前 级 ,转换 为 原 
字符 , 即 可 逐个 译 出 文件 中 的 所 有 字符 。 例 如 , 表 4-1 中 的 变 长 码 就 是 一 种 前 缀 码 。 对 于 给 
定 的 0,1 串 001011101 可 唯一 地 分 解 为 0,0,101,1101, 因 而 其 译 码 为 aabe。 

译 码 过 程 需要 方便 地 取出 编码 的 前 级 ,因此 ,需要 表示 前 级 码 的 合适 的 数据 结构 。 为 此 
目的 ,可 以 用 二 叉 树 作为 前 级 码 的 数据 结构 。 在 表示 前 级 码 的 二 叉 树 中 ,树叶 代表 给 定 的 字 
符 , 并 将 每 个 字符 的 前 级 码 看 作 是 从 树 根 到 代表 该 字符 的 树叶 的 一 条 道路 。 代 码 中 每 一 位 
的 0 或 1 分 别 作为 指示 某 结 点 到 左 儿 子 或 右 儿子 的 “路 标 ”。 

容易 看 出 ,表示 最 优 前 级 码 的 二 叉 树 总 是 一 棵 完全 二 叉 树 , 即 树 中 任 一 结 点 都 有 两 个 儿 
子 结 点 。 从 图 4-3 可 以 看 出 定 长 编码 方案 不 是 最 优 的 ,其 编码 二 又 树 不 是 一 棵 完全 二 又 树 。 
在 一 般 情 况 下 , 若 C 是 编码 字符 集 ,表示 其 最 优 前 级 码 的 二 叉 树 中 恰 有 |C| 个 叶子 。 每 个 叶 
子 对 应 于 字符 集中 一 个 字符 。 该 二 又 树 恰 有 |C| 一 1 个 内 部 结 点 。 

给 定编 码 字符 集 C 及 其 频率 分 布 , 即 C 中 任 一 字符 c 以 频率 jc) 在 数据 文件 中 出 
现 。C 的 一 个 前 绥 码 编码 方案 对 应 于 一 棵 二 又 树 工 。 字 符 c 在 树 工 中 的 深度 记 为 dzr(Cc)， 
dr(c) 也 是 字符 c 的 前 级 码 长 。 

这 种 编码 方案 的 平均 码 长 定义 为 BCT) = 了 )f (Odr(e)。 


EC 
使 平均 码 长 达到 最 小 的 前 级 码 编码 方案 称 为 C 的 最 优 前 级 码 。 
4.4.2 构造 哈 夫 曙 编 码 


哈 夫 曼 提出 构造 最 优 前 绥 码 的 贪心 算法 ,由 此 产生 的 编码 方案 称 为 哈 夫 曼 编码 。 哈 夫 
曼 算 法 以 自 底 向 上 的 方式 构造 表示 最 优 前 绥 码 的 二 叉 树 了 。 算 法 以 |C1 个 叶 结 点 开始 , 执 
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行 1C| 一 1 次 的 “合并 ”运算 后 产生 最 终 所 要 求 的 树 了 。 下 面 所 给 出 的 算法 huffmanTree 中 ， 
编码 字符 集中 每 一 字符 c 的 频率 是 f(c)。 以 f 为 键 值 的 优先 队列 Q 用 在 贪心 选择 时 有 效 
地 确定 算法 当前 要 合并 的 两 棵 具有 最 小 频率 的 树 。 一 旦 两 棵 具有 最 小 频率 的 树 合并 后 , 产 
生 一 棵 新 的 树 ,其 频率 为 合并 的 两 棵 树 的 频率 之 和 ,并 将 新 树 插入 优先 队列 Q。 

算法 中 用 到 的 类 Huffman 定义 如 下 : 

private static class Huffman implements Comparable 

{ 


Bintree tree; 


float weight; ”// 权 值 


private Huffman( Bintree tt, float ww) 
{ 
tree 一 tt; 


weight= ww; 


public int compareTo(Object x) 
{ 
float xw=((Huffman) x). weight; 


if (weight<xw) return—1; 


if (weight== xw) return 0; 
return 1; 

i 

算法 huffmanTree 描述 如 下 : 


public static Bintree huffmanTree(float [] f) 
{ 
// 生 成 单 结 点 树 
int n=f{. length; 
Huffman [] w=new Huffman [n+1]; 
Bintree zero 一 new Bintree(); 
for (int i=0; i<n; i 十 十 ) 
{ 
Bintree x 一 new Bintree(); 
x. makeTree(new MyInteger(i) zero, zero); 
w[i+1]=new Huffman(x, {[i]); 
} 


// 建 优先 队列 
MinHeap H=new MinHeap(); 


H. initialize(w, n); 


// 反 复合 并 最 小 频率 树 
for (int i=1; i<n; i 十 十 ) 


Huffman x= (Huffman) H. removeMin(); 
Huffman y= (Huffman) H. removeMin(); 
Bintree z 一 new Bintree(); 
z. makeTree(null, x. tree, y. tree) ; 
Huffman t=new Huffman(z, x. weight 十 y. weight); 
H. put(t); 
} 
return ((Huffman) H. removeMin()). tree; 


} 


算法 huffmanTree 首先 用 字符 集 C 中 每 一 字符 c 的 频率 (ce) 初始化 优先 队列 Q。 然 
后 不 断 地 从 优先 队列 Q 中 取出 具有 最 小 频率 的 两 棵 树 z 和 y ,将 它们 合并 为 一 棵 新 树 zx。x 
的 频率 是 zx 和 > 的 频率 之 和 。 新 树 = 以 z 为 其 左 儿 子 ,y 为 其 右 儿 子 ( 也 可 以 y 为 其 左 儿 
子 ,z 为 其 右 儿 子 。 不 同 的 次 序 将 产生 不 同 的 编码 方案 ,但 平均 码 长 是 相同 的 )。 经 过 nn 一 1 
次 的 合并 后 ,优先 队列 中 只 剩 下 一 棵 树 , 即 所 要 求 的 树 T。 

算法 huffmanTree 用 最 小 堆 实 现 优先 队列 Q。 初 始 化 优先 队列 需要 O(n) 计 算 时 间 , 由 
于 最 小 堆 的 removeMin 和 put 运算 均 需 O(logn) 时 间 ,n 一 1 次 的 合并 总 共 需 要 O(nlogn) 计 
算 时 间 。 因 此 ,关于 个 字符 的 哈 夫 曼 算法 的 计算 时 间 为 OCzlogz) 。 


4.4.3 哈 夫 曙 算 法 的 正确 性 


要 证 明 哈 夫 曼 算法 的 正确 性 ,只 需 证 明 最 优 前 级 码 问题 具有 贪心 选择 性 质 和 最 优 子 结 
构 性 质 。 

1. 贪心 选择 性 质 

设 C 是 编码 字符 集 ,C 中 字符 c 的 频率 为 f(c)。 又 设 z+ 和 yy 是 C 中 具有 最 小 频率 的 两 
个 字符 ,存在 C 的 最 优 前 级 码 使 + 和 y 具有 相同 码 长 且 仅 最 后 一 位 编码 不 同 。 

证 明 : 设 二 又 树 工 表示 C 的 任意 一 个 最 优 前 级 码 。 下 面 证 明 可 以 对 本 做 适当 修改 后 
得 到 一 棵 新 的 二 叉 树 T”, 使 得 在 新 树 中 x 和 y 是 最 深 叶 子 且 为 兄弟 。 同 时 新 树 T" 表 示 的 
前 缀 码 也 是 C 的 最 优 前 级 码 。 如 果 能 做 到 这 一 点 , 则 zx 和 wy 在 TT 表示 的 最 优 前 缀 码 中 就 
具有 相同 的 码 长 且 仅 最 后 一 位 编码 不 同 。 

设 b 和 c 是 二 叉 树 工 的 最 深 叶子 且 为 兄弟 。 不 失 一 般 性 可 设 f(5)f(c),f(z) 三 
f(y)。 由 于 xz 和 y 是 C 中 具有 最 小 频率 的 两 个 字符 , 故 f(x) 三 f(6) ,f(y) 志 fCc)。 

首先 在 树 T 中 交换 叶子 和 xz 的 位 置 得 到 树 T ,然后 在 树 T 中 再 交换 叶子 c 和 y 的 
位 置 ,得 到 树 T”, 如 图 4-3 所 示 。 

由 此 可 知 , 树 和 T' 表 示 的 前 级 码 的 平均 码 长 之 差 为 

BOT)—BOT) = Df OdO)— Df Odr Co) 
EC EC 


=f(xr)dr(z)i+ f(bdr(b) — f(x)dr (zr)— f(b)dr(b) 
=f(xz)dr(z) + f(b dr(b) — fr)dr(b) — f(b dr(r) 
=(f(6) — f(r)) (dr(b) — dr(z)) 

三 0 
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x c x 了 


4-3 编码 树 工 的 变换 


最 后 一 个 不 等 式 是 因为 f(5) 一 f(z) 和 dr(5b) 一 dr(x) 均 为 非 负 。 
类 似 地 ,可 以 证 明 在 T' 中 交换 y 与 c 的 位 置 也 不 增加 平均 码 长 , 即 BCT') 一 BC(T”) 也 是 
非 负 的 。 由 此 可 知 BC(T”) 三 BC(T') 三 BC(T)。 另 一 方面 ,由 于 了 所 表示 的 前 级 码 是 最 优 的 ， 
故 B(T) 三 BC(T”)。 因 此 ,B(T)==B(T”), 即 T* 表 示 的 前 级 码 也 是 最 优 前 缀 码 , 且 x 和 y 具 
有 最 长 的 码 长 ,同时 仅 最 后 一 位 编码 不 同 。 
2. 最 优 子 结构 性 质 
设 工 是 表示 字符 集 C 的 一 个 最 优 前 级 码 的 完全 二 叉 树 。C 中 字符 c 的 出 现 频率 为 
f(c)。 设 + 和 y 是 树 工 中 的 两 个 叶子 且 为 兄弟 ,= 是 它们 的 父亲 。 若 将 = 看 作 是 具有 频率 
f(x) 二 f(z) 十 f(y) 的 字符 , 则 树 T==T 一 {zx,y} 表 示 字 符 集 C' = 二 C 一 {zx,y})U {xz} 的 一 个 最 
优 前 绥 码 。 
证 明 : 首先 证 明代 的 平均 码 长 BCT) 可 用 全 的 平均 码 长 BCT) 表 示 。 
事实 上 ,对 任意 cEC 一 {z,y} 有 dr(c)=dr'(c), 故 FGc)dr(Cc) 一 FGc)dr(Cc)。 
另 一 方面 ,dr(Cz) 一 dr(y) 一 dr'(Cx) 十 1, 故 
FCz)dr(Cz) 十 FCy)dr(y) =(f(7) + f(y) dr (2) +1) 
=f(z)+ fy) + fz) dr (2) 
由 此 即 知 ,BC(T)=B(T 十 f(x) 十 f(y)。 
若 T" 所 表示 的 字符 集 C' 的 前 级 码 不 是 最 优 的 , 则 有 T“ 表 示 的 C' 的 前 级 码 使 得 B(T”) 
二 B(T')。 由 于 < 被 看 作 是 C' 中 的 一 个 字符 , 故 < 在 T” 中 是 一 树叶 。 若 将 xz 和 yy 加 入 树 TY 
中 作为 = 的 儿子 , 则 得 到 表示 字符 集 C 的 前 级 码 的 二 叉 树 T”, 且 有 
B(T”) =B(T’)+ f(z) + f(y) 
<BOT)+fz) + f(y) 
=B(T) 
这 与 了 的 最 优 性 矛盾 。 故 T' 所 表示 的 C' 的 前 级 码 是 最 优 的 。 
由 贪心 选择 性 质 和 最 优 子 结构 性 质 立 即 可 推出 : 哈 夫 曼 算法 是 正确 的 , 即 
huffmanTree 产生 C 的 一 棵 最 优 前 级 编码 树 。 


4.5 单 源 最 短路 径 


给 定 带 权 有 向 图 G 二 (V,E) ,其 中 每 条 边 的 权 是 非 负 实数 。 另 外 ,还 给 定 V 中 的 一 个 顶 
点 , 称 为 源 。 现 在 要 计算 从 源 到 所 有 其 他 各 项 点 的 最 短路 长 度 。 这 里 路 的 长 度 是 指 路 上 各 


边 权 之 和 。 这 个 问题 通常 称 为 单 源 最 短路 径 问 题 。 
4.5.1 算法 基本 思想 章 


Dijkstra 算法 是 解 单 源 最 短路 径 问 题 的 贪心 算法 。 其 基本 思想 是 ,设置 顶点 集合 S 并 
不 断 地 做 贪心 选择 来 扩充 这 个 集合 。 一 个 顶点 属于 集合 S 当 且 仅 当 从 源 到 该 顶点 的 最 短 
路 径 长 度 已 知 。 初 始 时 ,S 中 仅 含有 源 。 设 是 G 的 某 一 个 顶点 ,把 从 源 到 且 中 间 只 经 过 
S 中 顶点 的 路 称 为 从 源 到 的 特殊 路 径 , 并 用 数组 dist 记录 当前 每 个 顶点 所 对 应 的 最 短 特 
殊 路 径 长 度 。Dijkstra 算法 每 次 从 V 一 S 中 取出 具有 最 短 特殊 路 长 度 的 顶点 ,将 添加 到 
S 中 ,同时 对 数组 dist 进行 必要 的 修改 。 一 旦 S 包含 了 所 有 V 中 顶点 ,dist 就 记录 了 从 源 到 
所 有 其 他 顶点 之 间 的 最 短路 径 长 度 。 

Dijkstra 算法 可 描述 如 下 。 其 中 ,输入 的 带 权 有 向 图 是 G=(V,E),V=={1,2,…,n})。 
顶点 v 是 源 。a 是 一 个 二 维 数组 ,a[ 门 [站 表示 边 (i, 丫 的 权 。 当 (i,j) KE 时 ,a[ 门 [jj 是 一 个 
大 数 。dist[ 丫 表示 当前 从 源 到 顶点 i 的 最 短 特殊 路 径 长 度 。 


public static void dijkstra(int v, float [J][] a, float [] dist, int [] prev) 
{// 单 源 最 短路 径 问 题 的 Dijkstra 算法 
int n=dist. length—1; 
if (v<1 || v> n) return; 
boolean [] s=new boolean [n 十 1]; 
// 初 始 化 
for (int i=1; i <=n; i 十 十 ) 
{ 
dist[i]=a[v]J[i]; 
s[i]=false; 
if (dist[i]== Float. MAX_VALUE) prev[i]=0; 
else prev[i]=v; 
} 
dist[v]=0; s[v]=true; 
for (int i=1; i<n; i++) 
{ 
float temp= Float. MAX_VALUE; 
int u=v; 
for (int j=1;j<=n;j++) 
if ((! sDj]) && (dist[j]<temp)) 
{ 
u=js 
temp= dist[j]; 
} 
sLu]=true; 
for (int j=1; j <=n; j 十 十 ) 
i ((! s[j]) && CaLuj[j]<Float. MAX_VALUE)) 
{ 
float newdist 一 distLu] 十 aLu]D]; 
if Cnewdist<distDj]) 
{ 
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//dist[j] 减少 
dist[j]=newdist; 
prev[j]=u; 
} 
} 50 


} 
20 


例如 ,对 图 4-4 中 的 有 向 图 ,应 用 Dijkstra 算法 计算 从 源 顶 点 ”图 44 一 个 带 权 有 向 图 
1 到 其 他 顶点 间 最 短路 径 的 过 程 列 在 表 4-2 中 。 


表 4-2 Dijkstra 算法 的 迭代 过 程 


和 迭代 S u dist[2] dist[3] dist[4] dist[5] 
初始 {1} 二 10 co 30 100 
1 {1,2} 2 10 60 30 100 
2 {1,2,4} 4 10 50 30 90 
3 {T1243} 3 10 50 30 60 
4 {1;2,4,3,5} 5 10 50 30 60 


上 述 Dijkstra 算法 只 计算 出 从 源 顶 点 到 其 他 项 点 间 的 最 短路 径 长 度 。 如 果 还 要 求 相应 
的 最 短路 径 , 可 以 用 算法 中 数组 prev 记录 的 信息 找 出 相应 的 最 短路 径 。 算 法 中 数组 
prev[ 计 记录 的 是 从 源 到 顶点 守 的 最 短路 径 上 的 前 一 个 项 点。 初始 时 ,对 所 有 ;天 1, 置 
prev[ 引 二 v。 在 Dijkstra 算法 中 更 新 最 短路 径 长 度 时 ,只 要 dist[uj 十 cLuj[ 站 二 dist[ 让 时 ， 
就 置 prev[ 门 二 ww。 当 Dijkstra 算法 终止 时 ,就 可 以 根据 数组 prev 找到 从 源 到 i 的 最 短路 径 
上 每 个 顶点 的 前 一 个 顶点 ,从 而 找到 从 源 到 i 的 最 短路 径 。 

例如 ,对 于 图 4-4 中 的 有 向 图 ,经 Dijkstra 算法 计算 后 可 得 数组 prev 具有 值 
prev[2] 二 1,prevL[3] 二 4,prev[4] 二 1,prev[5] 二 3。 如 果 要 找 出 顶点 1 到 顶点 5 的 最 短路 
径 , 可 以 从 数组 prev 得 到 顶点 5 的 前 一 个 顶点 是 3,3 的 前 一 个 顶点 是 4,4 的 前 一 个 顶点 是 
1。 于 是 从 顶点 1 到 顶点 5 的 最 路 径 是 1 ,4,3,5。 


4.5.2 算法 的 正确 性 和 计算 复杂 性 
下 面 讨论 Dijkstra 算法 的 正确 性 和 计算 复杂 性 。 
1. 贪心 选择 性 质 
Dijkstra 算法 是 应 用 贪心 算法 设计 策略 的 又 一 个 典型 例子 。 它 所 做 出 的 贪心 选择 是 从 
V 一 S 中 选择 具有 最 短 特殊 路 径 的 顶点 ,从 而 确定 从 源 到 
& 的 最 短路 径 长 度 dist[u]。 这 种 贪心 选择 为 什么 能 导致 最 
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7 优 解 呢 ? 换 句 话说 ,为 什么 从 源 到 x 没有 更 短 的 其 他 路 径 
到 
< 一 


呢 ? 事实 上 ,如 果 存 在 一 条 从 源 到 w 且 长 度 比 dist[uj 更 短 

的 路 。 设 这 条 路 初次 走出 S 之 外 到 达 的 顶点 为 zxEV 一 S， 

然后 徘徊 于 S 内 外 若干 次 ,最 后 离开 S 到 达 ,如 图 4-5 
图 4-5 从 源 到 顶点 的 最 短路 径 ”所 示 。 


贫 心 算法 


在 这 条 路 径 上 ,分 别 记 d(v,z),d(z,w) 和 d(v,t) 为 顶点 v 到 顶点 x+, 顶点 工 到 顶点 

wu 和 顶点 v 到 顶点 的 路 长 ,那么 
dist[z] < d(v,zx) 
d(v,7)+d(r,u) = d(vu) < distLu] 

利用 边 权 的 非 负 性 ,可 知 d(z,w) 宇 0, 从 而 推 得 dist[z] 过 dist[u]。 此 为 矛盾 。 这 就 证 
明了 dist[uj 是 从 源 到 顶点 的 最 短路 径 长 度 。 

2. 最 优 子 结构 性 质 

要 完成 Dijkstra 算法 正确 性 的 证 明 ,还 必须 证 明 最 优 子 结构 性 质 , 即 算法 中 确定 的 
dist[aj 确 实 是 当前 从 源 到 顶点 x 的 最 短 特殊 路 径 长 度 。 为 此 ,只 要 考查 算法 在 添加 4 到 5S 


中 后 ,dist[] 的 值 所 起 的 变化 。 将 添加 之 前 的 S 称 为 Q 

老 的 S。 当 浅 加 了 之 后 ,可 能 出 现 一 条 到 顶点 ; 的 新 

的 特殊 路 。 如 果 这 条 新 特殊 路 是 先 经 过 旧 的 S 到 达 顶 co 

点 ,然后 从 经 一 条 边 直接 到 达 顶 点 ;, 则 这 种 路 的 最 © 


短 的 长 度 是 dist[w]j] 十 a[uj[ 让 。 这 时 ,如 果 dist[] 十 
a[wuj[ 让 过 dist[ 疏 , 则 算法 中 用 dist[uj] 十 a[uj[ 门 作为 
dist[ 门 的 新 值 。 如 果 这 条 新 特殊 路 径 经 过 旧 的 S 到 达 v 图 4-6 非 最 短 的 特殊 路 径 
后 ,不 是 从 v 经 一 条 边 直接 到 达 ;i 而 是 像 图 4-6 那样 ， 
回 到 旧 的 S 中 某 个 顶点 xz, 最 后 才 到 达 顶 点 i, 那 么 由 于 xz 在 老 的 S 中 ,因此 工 比 wx 先 加 入 
S, 故 图 4-6 中 从 源 到 > 的 路 的 长 度 比 从 源 到 ,再 从 到 z 的 路 的 长 度 小 。 于 是 当前 dist 
[ 妆 的 值 小 于 图 4-6 中 从 源 经 z 到 i 的 路 的 长 度 ,也 小 于 图 中 从 源 经 和 xz, 最 后 到 达 i 的 路 
的 长 度 。 因 此 ,在 算法 中 不 必 考 虑 这 种 路 。 由 此 即 知 ,不 论 算法 中 dist[u] 的 值 是 否 有 变化 ， 
它 总 是 关于 当前 顶点 集 S 的 到 顶点 的 最 短 特殊 路 径 长 度 。 

3. 计算 复杂 性 

对 于 具有 个 顶点 和 e 条 边 的 带 权 有 向 图 ,如 果 用 带 权 邻 接 和 矩阵 表示 这 个 图 ,那么 
Dijkstra 算 法 的 主 循环 体 需要 O(z) 时间 。 这 个 循环 需要 执行 一 1 次 ,所 以 完成 循环 需要 
OO2 时 间 。 算 法 的 其 余部 分 所 需要 时 间 不 超过 O(n ) 。 


4.6 最 小 生成 树 


设 G 一 (V,E) 是 无 向 连通 带 权 图 , 即 一 个 网 络 。 巨 中 每 条 边 (v,w) 的 权 为 cLvj[Lwj。 如 
果 G 的 子 图 G' 是 一 棵 包含 G 的 所 有 顶点 的 树 , 则 称 G 为 G 的 生成 树 。 生 成 树 上 各 边 权 的 
总 和 称 为 该 生成 树 的 耗费 。 在 G 的 所 有 生成 树 中 ,耗费 最 小 的 生成 树 称 为 G 的 最 小 生 
成 树 。 

网 络 的 最 小 生成 树 在 实际 中 有 广泛 应 用 。 例 如 ,在 设计 通信 网 络 时 ,用 图 的 顶点 表示 城 
市 ,用 边 (v,w) 的 权 cLvj[Lwj 表 示 建 立 城市 v 和 城市 w 之 间 的 通信 线路 所 需 的 费用 , 则 最 小 
生成 树 就 给 出 了 建立 通信 网 络 的 最 经 济 的 方案 。 


4.6.1 最 小 生成 树 性 质 
用 贪心 算法 设计 策略 可 以 设计 出 构造 最 小 生成 树 的 有 效 算法 。 本 节 介 绍 的 构造 最 小 生 
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成 树 的 Prim 算法 和 Kruskal 算法 都 可 以 看 作 是 应 用 贪心 算法 设计 策略 的 例子 。 尽 管 这 两 
个 算法 所 做 出 的 贪心 选择 的 方式 不 同 , 但 它们 都 利用 了 下 面 的 最 小 生成 树 性 质 : 

设 G=(V,E) 是 连通 带 权 图 ,U 是 V 的 真子 集 。 如 果 (w,v)E€E, 且 wu€EU,v€EV 一 U, 且 
在 所 有 这 样 的 边 中 ,(u,v) 的 权 cL[u][vj 最 小 ,那么 一 定 存在 G 的 一 棵 最 小 生成 树 , 它 以 
(us,v) 为 其 中 一 条 边 。 这 个 性 质 有 时 也 称 为 MST 性 质 。 

MST 性 质 可 证 明 如 下 : 

假设 G 的 任何 一 棵 最 小 生成 树 都 不 含 边 (u,v)。 将 边 (u,v) 添 加 到 G 的 一 棵 最 小 生成 
树 T 上 ,将 产生 含有 边 (u,v) 的 圈 , 并 且 在 这 个 圈 上 有 一 条 不 同 于 (u,v) 的 边 (w ,wv ) ,使 得 
u EU,v EV 一 U ,如 图 4-7 所 示 。 

将 边 (w ,vw ) 删 去 ,得 到 G 的 另 一 棵 生成 树 T’。 由 于 c[uj[vj 志 cLwu J][v, 所 以 TT 的 耗 
费 过 T 的 耗费 。 于 是 T' 是 一 棵 含有 边 (u,v) 的 最 小 生成 树 ,这 与 假设 矛盾 。 


4.6.2 Prim 算法 


设 G=(V,E) 是 连通 带 权 图 ,V 二 {1,2,…,n)。 构 造 G 的 最 小 生成 树 的 Prim 算法 的 基 
本 思想 是 : 首先 置 5 二 {1) ,然后 ,只 要 S 是 V 的 真子 集 ,就 进行 如 下 的 贪心 选择 : 选取 满足 
条 件 iE S,jEV 一 S, 且 c[ 让 [站 最 小 的 边 ,将 顶点 j 添加 到 S 中 。 这 个 过 程 一 直 进行 到 S= 
V 时 为 止 。 在 这 个 过 程 中 选取 到 的 所 有 边 恰好 构成 G 的 一 棵 最 小 生成 树 。 
public static void prim(int n, float [J[] c) 
{ 
T=@; 
S={1}s 
while (S!=V) 
{ 
(ij)=iES 且 jiEV 一 S 的 最 小 权 边 ; 
T=TU{(CGij))， 
S=SU 1j); 
} 
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算法 结束 时 ,TT 中 包含 G 的 n 一 1 条 边 。 利 用 最 小 生成 树 性 质 和 数学 归纳 法 容易 证 明 ， 
上 述 算法 中 的 边 集合 本 始终 包含 G 的 某 棵 最 小 生成 树 中 的 边 。 因 此 ,在 算法 结束 时 ,TT 中 
的 所 有 边 构 成 G 的 一 棵 最 小 生成 树 。 

例如 ,对 于 图 4-8 中 的 带 权 图 , 按 Prim 算法 选取 边 的 过 程 如 图 4-9 所 示 。 


图 4-7 含 边 (u,v) 的 圈 图 4-8 连通 带 权 图 


4-9 Prim 算法 选 边 过 程 


在 上 述 Prim 算法 中 ,还 应 当 考虑 如 何 有 效 地 找 出 满足 条 件 i€ S,j EV 一 S, 且 权 


c[ 刀 [站 最 小 的 边 (i,j)。 实 现 这 个 目的 的 较 简 单 的 办 法 是 设置 两 个 数组 closest 和 lowcost。 
对 于 每 一 个 jEV 一 S,closest[jj 是 j 在 S 中 的 邻接 顶点 , 它 与 jy 在 S 中 的 其 他 邻接 顶点 上 
相 比 较 有 c[j][closest[j]] 志 cLjj[k]。lowcost[7] 的 值 就 是 c[j][closest[j]]。 


在 Prim 算 法 执行 过 程 中 , 先 找 出 V 一 S 中 使 lowcost 值 最 小 的 顶点 j, 然 后 根据 数组 


closest 选取 边 (j ,closest[j]) ,最 后 将 了 添加 到 S 中 ,并 对 closest 和 lowcost 进行 必要 的 修改 。 


用 这 个 办 法 实现 的 Prim 算法 可 描述 如 下 。 其 中 ,c 是 一 个 二 维 数组 ,c[ 门 [ 门 表示 边 
(i, 让 的 权 。 


public static void prim(int n, float [J[] ec) 


{ //prim 算法 
float [] lowcost=new float [n+1]; 
int [] closest=new int [n+1]; 
boolean [] s=new boolean [nt+1]; 


s[1]=true; 

for (int i=2; i <=n; i 十 十 ) 

{ 
lowcost[i]=c[1J[i]; 
closest[i]=1; 
s[i]=false; 

} 

for (int i=1; i<n; i 十 十 ) 

和 
float min= Float. MAX_VALUE; 
int j=1; 
for (int k=2; k <=n; k 十 十 ) 


if ((lowcost[k]<min) &&(! sLk])) 
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{ 
min 一 lowcost[k]; 
j=k; 
} 
System. out. println(j 十 "，“ 十 closest[j])， 
s[j]=true; 
for (int k=2; k <=n; k 十 十 ) 
if ((cLjJCk]<lowcost[k]) & 8&(! s[k])) 
{ 
lowcost[k]=c[j]Ck]; 
closest[k]=j; 
} 


} 
可 知 , 上 述 算法 prim 所 需 的 计算 时 间 为 OG ) 。 
4.6.3 Kruskal 算法 


构造 最 小 生成 树 的 另 一 个 常用 算法 是 Kruskal 算法 。 当 图 的 边 数 为 e 时 ,Kruskal 算法 
所 需 的 时 间 是 O(eloge)。 当 e=Q(22 ) 时 ,Kruskal 算法 比 Prim 算法 差 ;但 当 e=o(n?) 时 ， 
Kruskal 算法 却 比 Prim 算法 好 得 多 。 

给 定 无 向 连通 带 权 图 G=(V,E).V=={1,2,…,n)。Kruskal 算法 构造 G 的 最 小 生成 树 
的 基本 思想 是 ,首先 将 G 的 个 顶点 看 成 n 个 孤立 的 连通 分 支 。 将 所 有 的 边 按 权 从 小 到 大 
排序 。 然 后 从 第 一 条 边 开 始 , 依 边 权 递 增 的 顺序 查看 每 一 条 边 ,并 按 下 述 方法 连接 两 个 不 同 
的 连通 分 支 : 当 查 看 到 第 条 边 (v,w) 时 ,如 果 端 点 v 和 ww 分别 是 当前 两 个 不 同 的 连通 分 
支 Tl 和 7T2 中 的 顶点 时 ,就 用 边 (v,w) 将 Tl 和 T2 连接 成 一 个 连通 分 支 ,然后 继续 查看 第 
十 1 条 边 ;如 果 端 点 v 和 ww 在 当前 的 同一 个 连通 分 支 中 ,就 直接 再 查看 第 & 十 1 条 边 。 这 个 
过 程 一 直 进行 到 只 剩 下 一 个 连通 分 支 时 为 止 。 此 时 ,这 个 连通 分 支 就 是 G 的 一 棵 最 小 生 
成 树 。 

例如 ,对 图 4-8 中 的 连通 带 权 图 , 按 Kruskal 算法 顺序 得 到 的 最 小 生成 树 上 的 边 如 
图 4-10 所 示 。 

关于 集合 的 一 些 基本 运算 可 用 于 实现 Kruskal 算法 。Kruskal 算法 中 按 权 的 递增 顺序 
查看 的 边 的 序列 可 以 看 作 一 个 优先 队列 , 它 的 优先 级 为 边 权 。 顺 序 查看 等 价 于 对 优先 队列 
执行 removeMin 运算 。 可 以 用 堆 实 现 这 个 优先 队列 。 

另外 ,在 Kruskal 算法 中 ,还 要 对 一 个 由 连通 分 支 组 成 的 集合 不 断 进 行 修改 。 将 这 个 由 
连通 分 支 组 成 的 集合 记 为 U, 则 需要 用 到 以 下 集合 的 基本 运算 。 

(1) union(a,5): 将 U 中 两 个 连通 分 支 a。 和 4 连接 起 来 ,所 得 的 结果 称 为 A 或 B。 

(2) find(vw): 返回 U 中 包含 顶点 v 的 连通 分 支 的 名 字 。 这 个 运算 用 来 确定 某 条 边 的 两 
个 端点 所 属 的 连通 分 支 。 

这 些 基 本 运算 实际 上 是 抽象 数据 类 型 并 查 集 UnionFind 所 支持 的 基本 运算 。 

利用 优先 队列 和 并 查 集 这 两 个 抽象 数据 类 型 可 实现 Kruskal 算法 如 下 : 


0 


(a) 


(d) (e) 
图 4-10 ”Kruskal 算法 选 边 过 程 


static class EdgeNode implements Comparable 


{ 


float weight; 


int u, vs; 


EdgeNode(int uu,int vv,float ww) 
{ 

u=uu; 

v 一 vvi; 


weight 一 ww 


public int compareTo(Object x) 

{ 
double xw 一 ((EdgeNode) x). weight; 
if (weight<xw) return 一 1; 
if (weight== xw) return 0; 


return 1; 


public static boolean kruskal (int n,int e, EdgeNode [] E, EdgeNode [] t) 


{ 


MinHeap H=new MinHeap(1); 

H. initialize(E, e); 

FastUnionFind U=new FastUnionFind(n); 
int k=0; 

while (e>0 && k<n—1) 

{ 
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EdgeNode x= (EdgeNode) H. removeMin(); 
ee™—™$ 
int a=U. find(x. u); 
int b= U. find(x. v); 
if (a !=b) 
{ 
tk 十 十 ] 一 xs 
U. union(a,b); 
} 

} 

return (k==n—1); 


} 

设 输入 的 连通 带 权 图 有 e 条 边 , 则 将 这 些 边 依 其 权 组 成 优先 队列 需要 O(e) 时 间 。 在 上 
述 算 法 的 while 循环 中 ,removeMin 运算 需要 O(loge) 时 间 , 因 此 ,关于 优先 队列 所 做 运算 的 
时 间 为 O(eloge) ,实现 UnionFind 所 需 的 时 间 为 O(eloge) 或 OCelog* e), 所 以 ,Kruskal 算法 
所 需 的 计算 时 间 为 O(eloge)。 


4.7 多 机 调度 问题 


设 有 nn 个 独立 的 作业 {1,2,…,n) ,由 m 台 相 同 的 机 器 进行 加 工 处 理 。 作 业 i 所 需 的 处 
理 时 间 为 t;。 现 约定 ,每 个 作业 均 可 在 任何 一 台 机 器 上 加 工 处理 , 但 未 完工 前 不 允许 中 断 处 
理 。 作 业 不 能 拆 分 成 更 小 的 子 作业 。 

多 机 调度 问题 要 求 给 出 一 种 作业 调度 方案 .使 所 给 的 个 作业 在 尽 可 能 短 的 时 间 内 由 
m 台 机 器 加 工 处 理 完成 。 

这 个 问题 是 NP 完全 问题 ,到 目前 为 止 还 没有 有 效 的 解法 。 对 于 这 一 类 问题 ,用 贪心 选 
择 策 略 有 时 可 以 设计 出 较 好 的 近似 算法 。 

采用 最 长 处 理 时 间作 业 优先 的 贪心 选择 策略 可 以 设计 出 解 多 机 调度 问题 的 较 好 的 近似 
算法 。 

按 此 策略 , 当 nm 时 ,只 要 将 机 器 i 的 [0,t;jJ 时 间 区 间 分 配给 作业 i 即 可 。 


当 nm 时 ,首先 将 个 作业 依 其 所 需 的 处 理 时 间 从 大 到 小 排序 。 然 后 依 此 顺序 将 作 
业 分 配给 空闲 的 处 理 机 。 


实现 该 策略 的 贪心 算法 greedy 可 描述 如 下 : 


static class JobNode implements Comparable 
, 
int id， 


time; 


JobNode(Cint i,int tt) 
{ 
id=i; 


time=tt; 


public int compareTo(Object x) 

{ 
int xt=((JobNode) x). time; 
if (time<xt) return—1; 
if (time== xt) return 0; 


return 1; 


static class MachineNode implements Comparable 
| 
int id， 


avail; 


MachineNode(int i,int a) 
{ 
id=i; 


avail=a; 


public int compareTo(Object x) 

{ 
int xa= ((MachineNode) x). avail; 
if (avail<xa) return—1; 
if (avail== xa) return 0; 


return 1; 


public static int greedy (int [] a, int m) 
{ 
int n=a. length 一 1; 
int sum 一 0; 
if (n <=m) 
{ 
for (int i 一 0;i 一 n;i 十 十 ) sum+t+=a[i]; 
System. out. println(" 为 每 个 作业 分 配 一 台 机 器 ."); 
return sum; 
} 
JobNode [] d=new JobNode [nj]; 
for (int i=0; i<n; i 十 十 ) 
dLi]=new JobNode(i 十 1,aLi 十 1])， 
MergeSort. mergeSort(d) ; 
MinHeap H=new MinHeap(m); 
for (int i=1; i <=m; i++) 
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‘ 
MachineNode x 一 new MachineNode(i,0); 
H. put(x); 
} 
for (int i=n; i>=1; i 一 一 ) 
{ 
MachineNode x= (MachineNode) H. removeMin(); 
System. out. println(" 将 机 器 "十 x. id 十 "从 "十 x. avail 十 "到 ” 
十 (x. avail 十 d[i 一 1]. time) 十 "的 时 间 段 分 配给 作业 "十 d[i 一 1]. id) ; 
x. avail 十 一 dLi 一 1].timey 
sum= x. avail; 
H. put(x); 
} 
return sum; 


} 


当 zz 时 ,算法 greedy 需要 O(1) 时 间 。 
当 nm 时 ,排序 耗 时 O(nlogn)。 初 始 化 堆 需 要 OCm) 时 间 。 关 于 堆 的 removeMin 和 
put 运算 共 耗 时 O(nlogm) ,因此 ,算法 greedy 所 需 
的 计算 时 间 为 O(nlog nn 十 nlogm) 二 O(nlogn)。 二 
例如 , 设 7 个 独立 作业 {1,2,3,4,5,6,7} 由 3 、 
台 机 器 M ,Ms 和 Ms 加 工 处 理 。 各 作业 所 需 的 处 " | 11 15 17 
理 时 间 分 别 为 {2, 14, 4, 16, 6,5,3)。 按 算法 
greedy 产生 的 作业 调度 如 图 4-11 所 示 , 所 需要 的 
加 工时 间 为 17。 


4-11 多 机 调度 示例 


4.8 ”贪心 算法 的 理论 基础 


借助 于 拟 阵 工具 ,可 以 建立 关于 贪心 算法 的 一 般 性 理论 。 这 个 理论 对 于 确定 何 时 使 用 
贪心 算法 可 以 得 到 问题 的 整体 最 优 解 十 分 有 用 。 


4.8.1 拟 阵 


拟 阵 M 定义 为 满足 下 面 3 个 条 件 的 有 序 对 (S, 了 7): 

(1) S 是 非 空 有 限 集 。 

(2) I 是 S 的 一 类 具有 遗传 性 质 的 独立 子 集 族 , 即 若 BET, 则 B 是 S 的 独立 子 集 , 且 B 
的 任意 子 集 也 都 是 S 的 独立 子 集 。 空 集 避 必 为 了 的 成 员 。 

(3) 工 满 足 交换 性 质 , 即 若 AET,BETI 且 AI 过 1B|, 则 存在 某 一 元 素 zxEB 一 A, 使 得 
AU{(zET。 

例如 , 设 S 是 一 给 定 矩 阵 中 行 向 量 的 集合 ,是 S 的 线性 独立 子 集 族 , 则 由 线性 空间 理 
论 容易 证 明 (S,D 是 一 拟 阵 。 

拟 阵 的 另 一 个 例子 是 无 向 图 G==(V.E) 的 图 拟 阵 Mo 二 (Sc ,16)。 其 中 ,Se 定义 为 图 G 
的 边 集 已 ,Tc 定义 为 So 的 无 循环 边 集 族 , 即 AE Ice 当 且 仅 当 它 构成 图 G 的 森林 。 
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依 此 定义 ,Mc 二 (Sc ,16) 是 拟 阵 。 事实 上 ,Sc 是 有 限 集 。 由 于 从 Se 的 无 循环 边 集中 去 
掉 车 干 边 不 会 产生 循环 , 即 森 林 的 任 一 子 集 还 是 森林 ,因此 ,I6 具有 遗传 性 质 。 进 一 步 ,还 
可 证 明 I 满足 交换 性 质 。 设 A 和 B 是 图 G 的 两 个 森林 上 且 1B| 放 |A|,; 即 A 和 B 都 是 无 循 
环 边 集 ,上 且 B 中 的 边 数 比 A 多 。 由 于 图 G 中 有 条 边 的 森林 恰 由 |V| 一 k 棵 树 组 成 。 从 G 
中 |V| 个 顶点 组 成 的 森林 开始 ,每 增加 一 条 边 就 减少 一 棵 树 。 因 此 ,森林 B 中 的 树 比 森 林 A 
中 的 树 少 。 由 此 可 推出 ,森林 B 中 存在 一 棵 树 工 , 它 的 顶点 在 森林 A 的 不 同 的 两 棵 树 中 。 
又 由 于 树 工 是 连通 的 , 故 工 中 必 有 一 边 (x,u) 使 得 顶点 w 和 w 在 森林 A 的 不 同 的 两 棵 树 
中 。 将 此 边 (u,v) 加 入 森林 A 不 会 产生 循环 。 因 此 ,lc 满足 交换 性 质 。 由 此 可 知 Me 是 
拟 阵 。 

给 定 拟 阵 M==(S, 了 ,对 于 了 中 的 独立 子 集 A ET, 车 S 有 一 元 素 xA, 使 得 将 x 加 入 
A 后 仍 保持 独立 性 , 即 AU {xz}ET, 则 称 z 为 A 的 可 扩展 元 素 。 

例如 ,在 图 拟 阵 Me 中 , 若 A 是 独立 边 集 , 则 边 e 是 A 的 可 扩展 元 素 是 指 边 e 不 在 A 
中 , 且 将 边 e 加 入 A 不 会 产生 循环 。 

当 拟 阵 M 中 的 独立 子 集 A 没有 可 扩展 元 素 时 , 称 A 为 极 大 独立 子 集 。 换 句 话 说 , 当 A 
不 被 M 中 别 的 独立 子 集 包 含 时 ,A 就 是 极 大 独立 子 集 。 下 面 的 关于 极 大 独立 子 集 的 性 质 是 
很 有 用 的 。 

定理 4.1 拟 阵 M 中 所 有 极 大 独立 子 集 大 小 相同 。 

证 明 : 用 反 证 法 。 设 A 和 B 是 M 的 极 大 独立 子 集 , 且 |1B| 二 1A|。 由 拟 阵 的 交换 性 质 
可 推出 ,存在 某 一 元 素 zx€E B 一 A 使 得 AU({zr)E1I。 这 与 A 是 极 大 独立 子 集 相 矛盾 。 同 理 ， 
|A1 二 1B| 也 将 导致 矛盾 , 故 |A|=1B|。 

在 关于 无 向 图 G 的 图 拟 阵 Me 中 ,Ms 的 极 大 独立 子 集 是 连接 图 G 中 所 有 顶点 且 有 
IV| 一 1 条 边 的 自由 树 。 这 种 树 就 是 图 G 的 生成 树 。 

若 对 拟 阵 M==(S, 耻 中 的 S 指定 权 函 数 克 ,使 得 对 于 任意 zxES, 有 多 (zz) 二 0, 则 称 拟 
阵 M 为 带 权 拟 阵 。 依 此 权 函 数 ,S 的 任 一 子 集 A 的 权 定 义 为 W(A) = We). 


例如 ,在 图 拟 阵 Me 中 ,定义 W(e) 为 边 e 的 长 度 , 则 W(A) 是 边 集 A 中 所 有 边 的 长 度 
之 和 。 


4.8.2 带 权 拟 阵 的 贪心 算法 


许多 可 以 用 贪心 算法 求解 的 问题 可 以 表示 为 求 带 权 拟 阵 的 最 大 权 独 立 子 集 问题 。 给 定 
带 权 拟 阵 M 二 (S, 了 ) ,确定 S 的 独立 子 集 A EI 使 得 W(A) 达 到 最 大 。 这 种 使 W(A) 最 大 的 
独立 子 集 A 称 为 拟 阵 M 的 最 优 子 集 。 由 于 S 中 任 一 元 素 z 的 权 W(zx) 是 正 的 ,因此 最 优 子 
集 也 一 定 是 极 大 独立 子 集 。 

例如 ,在 最 小 生成 树 问 题 中 ,要 找 出 无 向 图 G=(V,E) 的 一 棵 生成 树 , 使 该 树 各 边 长 之 
和 达到 最 小 。 其 中 ,各 边 的 边 长 由 边 长 函数 W 给 出 。 这 个 问题 可 以 表示 为 确定 带 权 拟 阵 
Ms 的 最 优 子 集 问题 。 其 中 ,Ms 是 图 G 的 图 拟 阵 ,上 且 权 函 数 W' 定 义 为 W'(e) 二 Wo 一 W(e)。 
Wo 是 比 G 中 最 大 边 长 还 大 的 一 个 正 数 。Mse 中 每 一 极 大 独立 子 集 A 相应 于 图 G 中 一 棵 生 
成 树 , 且 W'(A)==(IV| 一 DW。o 一 W(A)。 因 此 ,使 权 W'(A) 最 大 的 独立 子 集 A 必 使 W(A) 
达到 最 小 。 即 带 权 W' 的 Me 的 最 优 子 集 与 图 G 的 最 小 生成 树 之 间 存 在 一 一 对 应 关系 。 由 
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此 可 知 , 求 带 权 拟 阵 的 最 优 子 集 A 的 算法 可 用 于 解 最 小 生成 树 问题 。 
下 面 给 出 求 带 权 拟 阵 最 优 子 集 的 贪心 算法 。 该 算法 以 具有 正 权 函数 W 的 带 权 拟 阵 
M 一 (S,D) 作为 输入 ,经 计算 后 输出 M 的 最 优 子 集 A 。 
Set greedy (M,W) 
{ 
A=2; 
将 S 中 元 素 依 权 值 W( 大 者 优先 ) 组 成 优先 队列 ; 
while (S!= 2) 
{ 
S. removeMax(x); 
if (AU{x} ED A=AU{x}; 
上 
return A 


} 


算法 greedy 以 贪心 选择 的 方式 , 按 权 值 从 大 到 小 的 次 序 依次 考虑 其 中 元 素 +。 当 z 是 
A 的 可 扩展 元 素 时 ,就 将 zx 加 入 独立 集 A 中 ,否则 舍弃 了。 由 拟 阵 的 定义 , 空 集 是 独立 的 ,而 
且 在 算法 中 仅 当 AU {xz} 是 独立 集 时 才 将 xz 加 入 A, 故 由 归纳 法 即 知 A 总 是 独立 的 。 因 此 ， 
算法 greedy 返回 的 子 集 A 是 独立 子 集 。 稍 后 将 看 到 A 是 具有 最 大 权 的 独立 子 集 。 因 此 ,A 
是 最 优 子 集 。 

算法 greedy 的 计算 时 间 可 分 为 两 部 分 。 

设 * 一 1S|。 将 S 中 元 素 依 权 值 ( 大 者 优先 ) 组 成 优先 队列 。 次 removeMax 运算 需要 
Onlogn) 计 算 时 间 。 若 检测 AU1{z} 是 否 独立 需要 O(f(n)) 计 算 时 间 , 则 将 S 中 所 有 元 素 
检测 一 遍 需 要 的 计算 时 间 为 O(nf(n))。 因 此 ,算法 greedy 的 计算 时 间 复 杂 性 为 
O(nlogntnf(n)), 

下 面 证 明 算法 greedy 的 正确 性 , 即 它 返 回 的 独立 子 集 A 是 M 的 最 优 子 集 。 

引 理 4.2 拟 阵 的 贪心 选择 性 质 。 

设 M==(S, 了 是 具有 权 函 数 W 的 带 权 拟 阵 , 且 S 中 元 素 依 权 值 从 大 到 小 排列 。 又 设 
zES 是 S 中 第 一 个 使 得 {z} 是 独立 子 集 的 元 素 , 则 存在 S 的 最 优 子 集 A 使 得 zxEA。 

证 明 : 若 不 存在 xFS 使 得 {z} 是 独立 子 集 , 则 引 理 是 平凡 的 。 设 B 是 一 个 非 空 的 最 优 
子 集 。 由 于 BET, 且 工具 有 遗传 性 , 故 已 中 所 有 单个 元 素 > 组 成 的 子 集 {y) 均 为 独立 子 集 。 
又 由 于 z 是 S 中 的 第 一 个 单元 素 独 立 子 集 , 故 对 任意 的 yEB 均 有 : W(z) 宇 W(y)。 

车 xzEB, 则 只 要 取 A==B, 定 理 得 证 ;车 zB, 构 造 包 含 元 素 zx 的 最 优 子 集 A 如 下 。 一 
开始 , 设 A= {zx} ,此 时 ,A 是 独立 子 集 。 若 |B|=14|=1, 则 定理 得 证 ;否则 , 必 有 | 了 Bl 之 |A|。 
反复 利用 拟 阵 M 的 交换 性 质 ,从 B 中 选择 一 个 新 元 素 加 入 A 中 并 保持 A 的 独立 性 ,直至 
1B|==1A1。 此 时 , 必 有 一 元 素 yE€B 且 y 代 A, 使 得 A=B 一 (>}》U{z}。 由 此 可 知 

W(A) 王 W(B) 一 W(Cy) 十 W(Cz) 宇 W(B) 

男 一 方面 ,由 于 B 是 最 优 子 集 , 故 有 W(B) 宇 W(A)。 因 此 ,W(A)= 二 W(B), 即 A 也 是 
最 优 子 集 , 且 zEA。 

算法 greedy 在 以 贪心 选择 构造 最 优 子 集 A 时 ,首次 选 入 集合 A 中 的 元 素 x 是 单元 素 
独立 集中 具有 最 大 权 的 元 素 。 此 时 可 能 已 经 舍弃 了 S 中 部 分 元 素 。 可 以 证 明 这 些 被 舍弃 
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的 元 素 不 可 能 用 于 构造 最 优 子 集 。 
引 理 4.3 设 M==(S, 刀 是 拟 阵 。 若 S 中 元 素 z 不 是 空 集 妃 的 可 扩展 元 素 , 则 z 也 不 可 本 


能 是 S 中 任 一 独立 子 集 A 的 可 扩展 元 素 。 

证 明 : 用 反 证 法 。 设 zxES 不 是 空 集 的 可 扩展 元 素 , 但 它 是 S 的 独立 子 集 A 的 可 扩展 
元 素 , 即 AU{z}ET。 由 工 的 遗传 性 又 可 推出 {z} 是 独立 的 。 这 与 工 不 是 空 集 的 可 扩展 元 
素 相 矛盾 。 

由 引 理 4. 3 可 知 ,算法 greedy 在 初始 化 独立 子 集 A 时 所 舍弃 的 元 素 可 以 永远 舍弃 。 

引 理 4.4 拟 阵 的 最 优 子 结构 性 质 。 

设 z 是 求 带 权 拟 阵 M=(S,D) 的 最 优 子 集 的 贪心 算法 greedy 所 选择 的 S 中 的 第 一 个 
元 素 。 那 么 , 原 问 题 可 简化 为 求 带 权 拟 阵 M' ==(S',1) 的 最 优 子 集 问题 ,其 中 ， 

S'={y|ly€ SH{z,y} ET) 
T={B|BESS—{z}BBU {zx} ElT} 

M 的 权 函 数 是 M 的 权 函 数 在 S' 上 的 限制 ( 称 M' 为 M 关于 元 素 z 的 收缩 ) 。 

证 明 : 若 A 是 M 的 包含 元 素 z 的 最 大 权 独 立 子 集 , 则 A’ 二 A 一 {zx} 是 M 的 独立 子 集 。 
反之 ,M 的 任 一 独立 子 集 A' 产 生 M 的 独立 子 集 A = 二 A'U {zx)}。 在 这 两 种 情形 下 均 有 : 
W(A) 二 W(A’) 十 W(x)。 因 此 M 的 包含 元 素 z 的 最 优 子 集 包含 M' 的 最 优 子 集 ,反之 
亦 然 。 

定理 4.5 带 权 拟 阵 贪心 算法 的 正确 性 。 

设 M=(S, 了 是 具有 权 函 数 W 的 带 权 拟 阵 ,算法 greedy 返回 M 的 最 优 子 集 。 

证 明 : 由 引 理 4.2 知 , 若 算 法 greedy 第 一 次 选择 加 入 A 的 元 素 是 zx, 则 必 存 在 包含 元 素 
工 的 最 优 子 集 。 因 此 ,算法 greedy 的 第 一 次 选择 是 正确 的 。 由 引 理 4. 3 知 , 选 择 x 时 算法 
greedy 所 舍弃 的 元 素 不 可 能 是 最 优 子 集中 的 元 素 。 因 此 ,这 些 元 素 可 以 永远 舍弃 。 最 后 ， 
由 引 理 4.4 知 ,算法 greedy 选择 了 元 素 z 后 , 原 问 题 简化 为 求 拟 阵 M 的 最 优 子 集 问题 。 由 
于 对 于 M 中 任 一 独立 子 集 BE7T 均 有 BU{z}) 在 M 中 独立。 因此 ,算法 greedy 选择 了 元 素 
工 后 ,其 后 继 步 又 可 以 看 作 是 对 拟 阵 M'= (S’, 了 1 ) 进 行 计算 。 由 归纳 法 即 知 ,其 后 继 步 又 求 
出 M 的 一 个 最 优 子 集 , 从 而 算法 greedy 最 终 求 得 M 的 最 优 子 集 。 


4.8.3 任务 时 间 表 问题 


一 个 单位 时 间 任 务 是 恰好 需要 一 个 单位 时 间 完 成 的 任务 。 给 定 一 个 单位 时 间 任 务 的 有 
限 集 S。 关 于 S 的 一 个 时 间 表 用 于 描述 S 中 单位 时 间 任 务 的 执行 次 序 。 时 间 表 中 第 1 个 任 
务 从 时 间 0 开始 执行 直至 时 间 1 结束 ,第 2 个 任务 从 时 间 1 开始 执行 至 时 间 2 结束 ,…… ， 
第 个 任务 从 时 间 n 一 1 开始 执行 直至 时 间 n 结束 。 

具有 截止 时 间 和 误 时 惩罚 的 单位 时 间 任 务 时 间 表 问题 可 描述 如 下 : 

(1) n 个 单位 时 间 任 务 的 集合 S={1,2,…,n})。 

(2) 任务 i 的 截止 时 间 d;,1 志 i<n,1<d; 二 nn, 即 要 求 任务 i 在 时 间 4d; 之 前 结束 。 

(3) 任务 i 的 误 时 惩罚 w;,1 志 in, 即 任务 i 未 在 时 间 4d; 之 前 结束 将 招致 ww 的 惩罚 ; 
车 按时 完成 , 则 无 惩罚 。 

任务 时 间 表 问题 要 求 确定 S 的 一 个 时 间 表 (最 优 时 间 表 ) 使 得 总 误 时 惩罚 达到 最 小 。 

这 个 问题 看 上 去 很 复杂 ,然而 借助 于 拟 阵 , 可 以 用 带 权 拟 阵 的 贪心 算法 有 效 求解 。 
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对 于 一 个 给 定 的 S 的 时 间 表 ,在 截止 时 间 之 前 完成 的 任务 称 为 及 时 任务 ,在 截止 时 间 
之 后 完成 的 任务 称 为 误 时 任务 。S 的 任 一 时 间 表 可 以 调整 成 及 时 优先 的 形式 , 即 其 中 所 有 
及 时 任务 先 于 误 时 任务 ,而 不 影响 原 时 间 表 中 各 任务 的 及 时 或 误 时 性 质 。 事 实 上 , 若 时 间 表 
中 及 时 任务 x 跟 在 误 时 任务 y 之 后 , 则 交换 x 和 y 在 时 间 表 中 的 位 置 不 会 影响 二 者 的 及 时 
或 误 时 性 质 。 通 过 若干 次 的 这 种 交换 即 可 将 原 时 间 表 调整 成 为 及 时 优先 的 形式 。 

类 似 地 ,还 可 将 S 的 任 一 时 间 表 调整 成 为 规范 形式 ,其 中 及 时 任务 先 于 误 时 任务 , 且 及 
时 任务 依 其 截止 时 间 的 非 减 序 排列 。 首 先 可 将 时 间 表 调整 为 及 时 优先 形式 ,然后 再 进一步 
调整 及 时 任务 的 次 序 。 在 时 间 表 中 ,车 有 两 个 及 时 任务 i 和 j 分 别 在 时 间 k 和 时 间 & 十 1 完 
成 且 dj 二 d;, 则 交换 i 与 j 在 时 间 表 中 的 位 置 。 由 于 在 交换 前 任务 j 是 及 时 的 , 故 k 十 1 二 
dj 二 d;。 因 此 ,在 交换 位 置 后 十 1<d;, 即 任务 i 仍 是 及 时 任务 。 任 务 j 在 时 间 表 中 位 置 前 
移 , 故 交 换 位 置 后 任务 j 也 是 及 时 的 。 由 此 可 知 ,这 种 交换 不 影响 任务 i 和 任务 j 的 及 时 性 
质 。 经 过 若干 次 交换 即 可 将 时 间 表 调整 成 为 规范 形式 。 

通过 以 上 的 分 析 可 以 看 出 ,任务 时 间 表 问题 等 价 于 确定 最 优 时 间 表 中 及 时 任务 子 集 
A 的 问题 。 一 旦 确定 了 及 时 任务 子 集 A, 将 A 中 各 任务 依 其 截止 时 间 的 非 减 序列 出 , 然 
后 再 以 任意 次 序列 出 误 时 任务 , 即 S 一 A 中 各 任务 ,由 此 产生 S 的 一 个 规范 的 最 优 时 
间 表 。 

设 ASS 是 一 个 任务 子 集 ,车 有 一 个 时 间 表 使 得 A 中 所 有 任务 都 是 及 时 的 , 则 称 A 为 S 
的 一 个 独立 任务 子 集 。 显 然 ,S 的 任 一 时 间 表 中 及 时 任务 构成 的 集合 均 为 S 的 独立 任务 子 
集 。 记 了 为 S 的 所 有 独立 任务 子 集 所 构成 的 集合 。 

对 时 间 t= 二 1,2,…,n, 设 N,(A) 是 任务 子 集 A 中 所 有 截止 时 间 是 7 或 更 早 的 任务 数 。 
考查 任务 子 集 A 的 独立 性 。 

引 理 4.6 对 于 S 的 任 一 任务 子 集 A ,下 面 的 各 个 命题 是 等 价 的 。 

(1) 任务 子 集 A 是 独立 子 集 。 

(2) 对 于 t=1,2,*…,n, N,(A)<t。 

(3) 车 A 中 任务 依 其 截止 时 间 非 减 序 排列 , 则 A 中 所 有 任务 都 是 及 时 的 。 

证 明 : (1) 一 (2): 若 任务 集 A 是 独立 的 , 且 存 在 某 个 1 使 得 N,(A) 记 t, 则 A 中 有 多 于 + 
个 任务 要 在 时 间 1 之 前 完成 ,显然 这 是 办 不 到 的 。 故 A 中 必 有 误 时 任务 。 这 与 A 是 独立 任 
务 子 集 矛盾 。 因 此 ,对 所 有 t==1,2,…,n 有 NN,(A)<t。 

(2) 二 (3) :车 A 中 任务 依 其 截止 时 间 的 非 减 序 排列 , 则 (2) 中 不 等 式 意味 着 排序 后 A 中 
第 i 个 任务 的 截止 时 间 在 时 间 i 之 后 。 故 排序 后 A 中 所 有 任务 都 是 及 时 的 。 

(3) 二 (1) :显而易见 ,很 容易 证 明 。 

引 理 4. 6 中 的 性 质 (2) 可 用 于 有 效 地 判断 一 个 给 定 的 任务 子 集 的 独立 性 。 

任务 时 间 表 问题 要 求 使 总 误 时 惩罚 达到 最 小 ,这 等 价 于 使 任务 时 间 表 中 的 及 时 任务 的 
惩罚 值 之 和 达到 最 大 。 下 面 的 定理 表明 可 用 带 权 拟 阵 的 贪心 算法 解 任务 时 间 表 问题 。 

定理 4.7 设 S 是 带 有 截止 时 间 的 单位 时 间 任 务 集 ,I 是 S 的 所 有 独立 任务 子 集 构 成 
的 集合 , 则 有 序 对 (S, 也 是 拟 阵 。 

证 明 : 独立 任务 集 的 子 集 显然 也 是 独立 子 集 , 故 了 满足 遗传 性 质 。 下 面 证 明 (S, 了 满足 
交换 性 质 。 

设 A 和 召 为 两 个 独立 任务 子 集 且 |B1>1A|。 设 k= max{(t| N,(B)<N,(A)}. 由 于 
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N,.(B)==|B|,N,(A)==|1A1, 而 |B| 二 1A1, 即 N(CB)>N (CA)。 因 此 必 有 &<2, 且 对 于 满 
足 & 十 1<5 和 2 的 有 NiCB)>Ni(A)。 取 zEB 一 A 且 z 的 截止 时 间 为 & 十 1, 令 A'=AU 章 


{zx}, 可 以 证 明 A’ 是 独立 的 。 事实 上 .由 于 A 是 独立 的 , 故 对 1 三 :三 k 有 
N,(A')==N,(A)<t。 又 由 于 B 是 独立 的 , 故 对 k<t<n 有 N,(A’) = 二 N,(A) 二 1<N,(B)<i。 
由 引 理 4. 6 即 知 A' 是 独立 的 。 综 上 所 述 ,(S, 了 是 拟 阵 。 

由 定理 4.5 可 知 , 用 带 权 拟 阵 的 贪心 算法 可 以 求 得 最 大 权 ( 惩 罚 ) 独 立 任务 子 集 A, 以 A 
作为 最 优 时 间 表 中 的 及 时 任务 子 集 ,容易 构造 最 优 时 间 表 。 

任务 时 间 表 问题 的 贪心 算法 的 计算 时 间 复 杂 性 是 O(nlogn 十 nf(n))。 其 中 ,了 (是 用 
于 检测 任务 子 集 A 的 独立 性 所 需 的 时 间 。 用 引 理 4.6 中 性 质 (2) 容 易 设 计 一 个 O(n) 时 间 算 
法 来 检测 任务 子 集 的 独立 性 。 因 此 ,整个 算法 的 计算 时 间 为 O(m*)。 具 体 算法 greedyJob 
可 描述 如 下 。 其 中 d[ 杂 ,1<i<n, 是 个 单位 时 间 任 务 的 截止 时 间 , 且 个 单位 时 间 任 务 已 
依 其 误 时 惩罚 的 非 增 序 排列 。job[ 丫 是 最 优 解 中 的 第 i 个 任务 。 


public static int greedyJob (int [] d, int [] w, int [Jjob) 
《 
int n 一 d. length 一 1; 
dLo]=0;job[0]=0; 
int k 一 1; 
job[1]=1; 
for (int i=2;i<=n;it++) 
{ 
int r=k; 
while ((d[job[r]]>d[i]) & 8&(d[Ljob[r]]!=7)) r 一 一 ; 
if ((d[job[r]]<=d[i]) & 8&(d[i]>7)) 
{ 
for (int m=k;m>r;m——) 
jobL[m+1]=jobLm]; 
job[r+1]=i; 
k++ 
} 
} 
for (int i=1;i<=k;i++) 
w[Ljob[i]]=0; 
int sum 一 0; 
for (int i 一 15i< 一 nj;i 十 十 ) 
if (w[]>0) 
{ 
job[ 二 十 k]=i; 
sum++=w[i]; 
} 
return sum; 


} 
例如 ,给 定单 位 时 间 任 务 集 S 及 各 任务 的 截止 时 间 和 误 时 惩罚 如 下 : 
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i 1 2 2 4 5 6 7 
d[] 4 4 3 1 4 6 
[可 70 60 50 40 30 20 10 


算法 greedyJob 先 选择 任务 1,2,3,4, 然 后 舍弃 任务 5,.6 ,最 后 再 选择 任务 7。 算 法 得 到 


的 最 优 时 间 表 为 {2,4,1,3,7,5,6}。 其 总 误 时 惩罚 为 W[5j] 十 W[6]==50, 达 到 最 小 。 


用 抽象 数据 类 型 并 查 集 UnionFind 可 对 上 述 算法 做 进一步 改进 。 为 了 给 后 继任 务 留 
下 尽 可 能 大 的 选择 空间 ,在 选择 了 任务 i 时 ,将 [0,1],[1,2],…,[d; 一 1,d;] 中 最 右 端的 空 
闲 时 间 区 间 分 配给 任务 i。 任 何 一 个 最 优 时间 表 最 多 只 能 安排 6 二 min{n, max({d;)} 个 及 时 
任务 。 为 方便 起 见 ,直接 用 i 表示 时 间 区 间 [i 一 1, 门 ,以 0 表示 左 端 空闲 区 间 [ 一 1,0]。 设 六 
表示 小 于 或 等 于 的 最 右 端 空 闪 区间, 则 ni。 将 时 间 区 间 划 分 为 一 些 等 价 类 ,时 间 区 间 i 


和 j 属于 同一 等 价 类 当 且 仅 当 ni 二 1， 该 等 价 类 就 以 ni 命名。 初始 时 有 0,1,… 


履 共 5b 十 1 


个 等 价 类 。 在 安排 截止 时 间 为 d 的 任务 时 , 先 用 find 找到 含有 时 间 区 间 min{n,d} 的 等 价 
类 ,k 就 表示 可 以 安排 当前 任务 的 最 右 端的 那个 空闲 时 间 区 间 。 安 排 后 ,用 union 将 等 价 


类 上 与 含有 时 间 区 间 & 一 1 的 等 价 类 合并 。 


改进 后 的 算法 fasterJob 描述 如 下 : 


public static int fasterJob(int [] d, int [] w, int [] job) 


{ 


int n=d. length—1; 


int [] f=new int [nt+1]; 


for (int i=0;i<=n;i+t+) {[i]=i; 
FastUnionFind U= new FastUnionFind(n); 


int k=0, t=0; 


for (int i=1;i<=n;it++) 


{ 


int m= (n<d[i])? U. find(n):U. find(d[i]); 


if [mJ>0) 

{ 
k=k 二 1; 
job[k]=i; 
if (f[m]>1) 
{ 


t=U. find(f[m]—1); 


U. union(t,m); 
} 
else t=0; 
f{[m]={[t]; 
} 
} 


for (int i=1;i<=k;i++) 


wLjob[i]]=0; 


int sum=0; 


for (int i 一 1;i 一 一 nj;i 十 十 ) 
if (w[i]>0) 
{ 
job[ 十 十 k] 一 i 
sum 二 二 w[i]; 
) 
return sum; 


} 


算法 fasterJob 用 到 的 find 和 union 运算 的 次 数 都 不 超过 nn 次 。 因 此 ,如 果 不 计 预 处 理 
的 时 间 ,算法 fasterJob 所 需 的 计算 时 间 为 O(nlog* n)。 


小 结 


本 章 介绍 的 贪心 算法 也 是 一 种 重要 的 算法 设计 策略 , 它 与 动态 规划 算法 的 设计 思想 有 
一 定 的 联系 ,但 其 效率 更 高 。 按 照 贪心 算法 设计 出 来 的 许多 算法 能 导致 最 优 解 。 其 中 有 许 
多 典型 问题 和 典型 算法 可 供 学 习 和 使 用 。 本 章 以 具体 实例 ,如 活动 安排 问题 .最 优 装载 问 
题 , 哈 夫 曼 编码 等 ,详细 阐述 了 贪心 算法 的 设计 思想 、 适 用 性 以 及 贪心 算法 的 基本 要 素 和 算 
法 的 设计 要 点 。 最 后 讨论 了 借助 于 拟 阵 工具 ,建立 关于 贪心 算法 的 一 般 理论 。 这 个 理论 对 
确定 何 时 使 用 贪心 算法 可 以 得 到 问题 的 整体 最 优 解 十 分 有 用 。 


习 题 


4-1 在 活动 安排 问题 中 ,还 可 以 有 其 他 的 贪心 选择 方案 ,但 并 不 能 保证 产生 最 优 解 。 给 出 
一 个 例子 ,说 明 若 选择 具有 最 短 时 段 的 相 容 活动 作为 贪心 选择 ,得 不 到 最 优 解 ; 若 选 择 
覆盖 未 选择 活动 最 少 的 相 容 活动 作为 贪心 选择 ,也 得 不 到 最 优 解 。 

4-2 证明 背包 问题 具有 贪心 选择 性 质 。 

4-3 若 在 0-1 背包 问题 中 ,各 物品 依 重 量 递 增 排列 时 ,其 价值 恰好 依 递 减 序 排列 。 对 这 个 
特殊 的 0-1 背包 问题 ,设计 一 个 有 效 算法 找 出 最 优 解 ,并 说 明 算 法 的 正确 性 。 

4-4 假定 要 把 长 为 2 ,2 ，… 的 2 个 程序 放 在 磁带 T, 和 了 ,上 ,并 且 希 望 按照 使 最 大 检 
索 时 间 取 最 小 值 的 方式 存放 , 即 如 果 存 放 在 六 和 T: 上 的 程序 集合 分 别 是 A 和 B, 则 


希望 所 选择 的 A 和 B 使 得 max{ D424} 取 最 小 值 。 贪 心算 法 : 开始 将 A 和 B 
i€EA i€EB 
都 初始 化 为 空 , 然 后 一 次 考虑 一 个 程序 ,如 果 2) = min{ 224;,224}, 则 将 当前 正 
i€EA iEA iEB 

在 考虑 的 那个 程序 分 配给 A; 和 否则 .分 配给 B。 证 明 无 论 是 按 Li 二 1, 三 … 三 1, 或 是 按 
人 1 三 4 三 … 三 4, 的 次 序 来 考虑 程序 ,这 种 方法 都 不 能 产生 最 优 解 。 应 当 采 用 什么 策略 ? 
写 出 一 个 完整 的 算法 并 证 明 其 正确 性 。 

4-5 将 最 优 装载 问题 的 贪心 算法 推广 到 2 艘 船 的 情形 ,贪心 算法 仍 能 产生 最 优 解 吗 ? 

4-6 字符 a 一 h 出 现 的 频率 恰好 是 前 8 个 Fibonacci 数 , 它 们 的 哈 夫 曼 编码 是 什么 ?将 结果 
推广 到 个 字符 的 频率 恰好 是 前 个 Fibonacci 数 的 情形 。 

4-7 设 C={0,1,…,n 一 1) 是 个 字符 的 集合 。 证 明 关于 C 的 任何 最 优 前 绥 码 可 以 表示 长 
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度 为 22 一 1 二 z| logn | 位 的 编码 序列 (提示 : 用 2n 一 1 位 描述 树 结构 ) 。 

说 明 如 何 用 引 理 4.6 的 性 质 (2) ,在 O(|A|) 时 间 里 确定 给 定 的 任务 集 A 是 否 独立 。 
给 定 nXn 实 值 算 阵 工 ,证 明 (S, 了 是 拟 阵 。 其 中 ,S 是 工 的 列 向 量 的 集合 ,AET 当 上 且 
仅 当 A 中 的 列 是 线性 独立 的 。 

说 明 如 何 变换 带 权 拟 阵 的 权 函 数 ,使 最 小 权 最 大 独立 子 集 问题 变换 为 等 价 的 标准 带 
权 拟 阵 问 题 , 并 证 明 变换 的 正确 性 。 

假设 具有 个 顶点 的 连通 带 权 图 中 所 有 边 的 权 值 均 为 从 1 到 之 间 的 整数 ,能 对 
Kruskal 算法 做 何 改 进 ? 时间 复 杂 性 能 改进 到 何 程度 ? 车 对 某 常 量 N, 所 有 边 的 权 
值 均 为 从 1 到 N 之 间 的 整数 ,在 这 种 情况 下 又 如 何 ? 在 上 述 两 种 情况 下 ,对 Prim 算 
法 能 做 何 改进 ? 

试 设 计 一 个 构造 图 G 生成 树 的 算法 ,使 得 构造 出 的 生成 树 的 边 的 最 大 权 值 达到 
最 小 。 

试 举 例 说 明 如 果 人 允许 带 权 有 向 图 中 某 些 边 的 权 为 负 实数 , 则 Dijkstra 算法 不 能 正确 
求 得 从 源 到 所 有 其 他 顶点 的 最 短路 径 长 度 。 

设 G 是 具有 nn 个 顶点 和 e 条 边 的 带 权 有 向 图 ,各 边 的 权 值 为 0 一 N 一 1 之 间 的 整数 ， 
NN 为 一 非 负 整 数 。 修 改 Dijkstra 算法 使 其 能 在 OCNn 十 e) 时 间 内 计算 出 从 源 到 所 有 
其 他 顶点 之 间 的 最 短路 径 长 度 。 


第 章 
可 


回溯 法 有 “通用 解 题 法 ?之 称 。 用 它 可 以 系统 地 搜索 问题 的 所 有 解 。 回 溯 法 是 一 个 
既 带 有 系统 性 又 带 有 跳跃 性 的 搜索 算法 。 它 在 问题 的 解 空 间 树 中 , 按 深度 优先 策略 ,从 
根 结 点 出 发 搜索 解 空间 树 。 算 法 搜索 至 解 空间 树 的 任 一 结 点 时 , 先 判断 该 结 点 是 否 包 含 
问题 的 解 。 如 果 肯 定 不 包含 , 则 跳 过 对 以 该 结 点 为 根 的 子 树 的 搜索 , 逐 层 向 其 祖先 结 点 
回溯 ;否则 ,进入 该 子 树 ,继续 按 深度 优先 策略 搜索 。 回 漳 法 求 问题 的 所 有 解 时 ,要 回 淹 
到 根 , 且 根 结 点 的 所 有 子 树 都 被 搜索 遍 才 结束 。 回 淹 法 求 问题 的 一 个 解 时 ,只 要 搜索 到 
问题 的 一 个 解 就 可 结束 。 这 种 以 深度 优先 方式 系统 搜索 问题 解 的 算法 称 为 回溯 法 , 它 适 
用 于 求解 组 合 数 较 大 的 问题 。 


5.1 回溯 法 的 算法 框架 


5.1.1 问题 的 解 室 间 


用 回 湖 法 解 问题 时 ,应 明确 定义 问题 的 解 空间 。 问 题 的 解 空 间 至 少 应 包含 问题 的 一 个 
(最 优 ) 解 。 例 如 ,对 于 有 nn 种 可 选择 物品 的 0-1 背包 问题 ,其 解 空间 由 长 度 为 于 的 0-1 向 量 
组 成 。 该 解 空间 包含 对 变量 的 所 有 0-1 赋值 。 当 n= 二 3 时 ,其 解 空间 是 : 

{(0,0,0),(0,1,0),(0,0,1),(1,0,0),(0,1,1),(1,0,1),(1,1,0),(1,1,1))》 

定义 了 问题 的 解 空间 后 ,还 应 将 解 空 间 很 好 地 组 织 起 来 ,使 得 能 用 回溯 法 方便 地 搜索 整 
个 解 空间 。 通 常 将 解 空 间 组 织 成 树 或 图 的 形式 。 

例如 ,对 于 n=3 时 的 0-1 背包 问题 ,可 用 完全 二 又 树 表 示 其 解 空 间 , 如 图 5-1 所 示 。 


图 5-1 0-1 背包 问题 的 解 空间 树 


解 空间 树 的 第 i 层 到 第 i 十 1 层 边 上 的 标号 给 出 了 变量 的 值 。 从 树 根 到 叶 的 任 一 路 径 
表示 解 空间 中 的 一 个 元 素 。 例 如 ,从 根 结 点 到 结 点 HH 的 路 径 相应 于 解 空间 中 元 素 (1,1,1)。 
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5.1.2 回 淹 法 的 基本 思想 


确定 了 解 空间 的 组 织 结构 后 ,回溯 法 从 开始 结 点 ( 根 结 点 ) 出 发 ,以 深度 优先 方式 搜 
索 整 个 解 空间 。 这 个 开始 结 点 成 为 活 结 点 ,同时 也 成 为 当前 的 扩展 结 点 。 在 当前 扩展 结 
点 处 ,搜索 向 纵深 方向 移 至 一 个 新 结 点 。 这 个 新 结 点 成 为 新 的 活 结 点 ,并 成 为 当前 扩展 
结 点 。 如 果 在 当前 扩展 结 点 处 不 能 再 向 纵深 方向 移动 , 则 当前 扩展 结 点 就 成 为 死结 点 。 
此 时 ,应 往 回 移动 (回溯 ) 至 最 近 的 活 结 点 处 ,并 使 这 个 活 结 点 成 为 当前 扩展 结 点 。 回 漳 
法 以 这 种 工作 方式 递归 地 在 解 空间 中 搜索 ,直至 找到 所 要 求 的 解 或 解 空间 中 已 无 活 结 点 
时 为 止 。 

例如 ,对 于 ?一 3 时 的 0-1 背包 问题 ,考虑 下 面 的 具体 实例 : w= 二 [16,15,15],p 二 [45， 
25,25],c 王 30。 从 图 5-1 的 根 结 点 开始 搜索 解 空间 。 开 始 时 , 根 结 点 是 唯一 的 活 结 点 ,也 是 
当前 扩展 结 点 。 在 这 个 扩展 结 点 处 ,可 以 沿 纵深 方向 移 至 结 点 B 或 结 点 C。 假 设 选择 先 移 
至 结 点 B。 此 时 , 结 点 A 和 结 点 B 是 活 结 点 , 结 点 B 成 为 当前 扩展 结 点 。 由 于 选取 了 rw ， 
故 在 结 点 B 处 剩余 背包 容量 是 ”一 14, 获 取 的 价值 为 45。 从 结 点 B 处 ,可 以 移 至 结 点 D 或 
EE。 由 于 移 至 结 点 D 至 少 需要 we, 二 15 的 背包 容量 ,而 现在 仅 有 的 背包 容量 是 ~ 一 14, 故 移 
至 结 点 D 导致 不 可 行 解 。 搜 索 至 结 点 下 不 需要 背包 容量 ,因而 是 可 行 的 。 从 而 选择 移 至 结 
点 下 。 此 时 ,E 成 为 新 的 扩展 结 点 , 结 点 A,B 和 下 是 活 结 点 。 在 结 点 EE 处 ,r= 二 14, 获 取 的 价 
值 为 45。 从 结 点 下 处 ,可 以 向 纵深 移 至 结 点 本 或 民 。 移 至 结 点 本 导致 不 可 行 解 ,而 移 向 结 点 
K 是 可 行 的 ,于 是 移 向 结 点 K, 它 成 为 新 的 扩展 结 点 。 由 于 结 点 K 是 叶 结 点 , 故 得 到 一 个 可 
行 解 。 这 个 解 相应 的 价值 为 45。z; 的 取 值 由 根 结 点 到 叶 结 点 K 的 路 径 唯 一 确定 , 即 一 
(1,0,0)。 由 于 在 结 点 K 处 已 不 能 再 向 纵深 扩展 ,所 以 结 点 K 成 为 死结 点 。 返 回 到 结 点 也 
处 。 此 时 在 结 点 E 处 也 没有 可 扩展 的 结 点 , 它 也 成 为 死结 点 。 

接 下 来 又 返回 到 结 点 B 处 。 结 点 B 同样 也 成 为 死结 点 ,从 而 结 点 A 再 次 成 为 当前 扩展 
结 点 。 结 点 A 还 可 继续 扩展 ,从 而 到 达 结 点 C。 此 时 ,r==30, 获 取 的 价值 为 0。 从 结 点 C 可 
移 向 结 点 下 或 G。 假 设 移 至 结 点 下 , 它 成 为 新 的 扩展 结 点 。 结 点 A,C 和 下 是 活 结 点 。 在 结 
点 下 处 ,r= 二 15, 获 取 的 价值 为 25。 从 结 点 下 ,向 纵深 移 至 结 点 工 处 ,此 时 ,r==0, 获 取 的 价值 
为 50。 由 于 工 是 叶 结 点 ,而 且 是 迄今 为 止 找 到 的 获取 价值 最 高 的 可 行 解 ,因此 记录 这 个 可 
行 解 。 结 点 L 不 可 扩展 ,又 返回 到 结 点 下 处 。 按 此 方式 继续 搜索 ,可 搜索 遍 整 个 解 空间 。 
搜索 结束 后 找到 的 最 好 解 是 相应 0-1 背包 问题 的 最 优 解 。 

青 看 一 个 用 回溯 法 解 旅行 售货员 问题 的 例子 。 

旅行 售货员 问题 的 提 法 是 : 某 售货员 要 到 若干 城市 去 推销 商品 ,已 知 各 城市 之 间 的 路 
程 (或 旅费 )。 他 要 选 定 一 条 从 驻地 出 发 ,经 过 每 个 城市 一 次 ,最 后 回 到 驻地 的 路 线 , 使 总 的 
路 程 (或 总 旅费 ) 最 短 (或 最 小 )。 

问题 刚 提 出 时 ,不 少 人 都 认为 这 个 问题 很 简单 。 后 来 ,在 实践 中 才 逐 步 认识 到 ,这 个 问 
题 只 是 叙述 简单 ,易于 理解 ,而 其 计算 复杂 性 却 是 问题 输入 规模 的 指数 函数 ,属于 相当 难 解 
的 问题 之 一 。 事 实 上 , 它 是 NP 完全 问题 。 这 个 问题 可 以 用 图 论语 言 形式 描述 。 

设 G==(V,E) 是 一 个 带 权 图 。 图 中 各 边 的 费用 ( 权 ) 为 正 数 。 图 的 一 条 周游 路 线 是 包括 
V 中 的 每 个 顶点 在 内 的 一 条 回路 。 周 游 路 线 的 费用 是 这 条 路 线 上 所 有 边 的 费用 之 和 。 旅 行 
售货员 问题 要 在 图 G 中 找 出 费用 最 小 的 周游 路 线 。 


回 注 法 


图 5-2 是 一 个 4 顶点 无 向 带 权 图 。 顶 点 序列 1,2,4,3,1;1,3,2,4,1 和 1,4,3,2,1 是 该 
图 中 3 条 不 同 的 周游 路 线 。 

旅行 售货员 问题 的 解 空间 可 以 组 织 成 一 棵 树 ,从 树 的 根 结 点 到 任 一 叶 结 点 的 路 径 定义 
了 图 G 的 一 条 周游 路 线 。 图 5-3 是 当 ?z 一 4 时 解 空间 的 示例 。 其 中 ,从 根 结 点 A 到 叶 结 点 工 


的 路 径 上 边 的 标号 组 成 一 条 周游 路 线 1,2,3,4,1。 从 根 结 点 到 叶 结 点 O 的 路 径 表示 周游 路 
线 1,3,4,2,1。 图 G 的 每 一 条 周游 路 线 都 恰好 对 应 于 解 空间 树 中 一 条 从 根 结 点 到 叶 结 点 的 


路 径 。 因 此 , 解 空 间 树 中 叶 结 点 个 数 为 (x 一 1)1。 


G 六 一 过 
图 5-2 4 顶点 带 权 图 图 5-3 旅行 售货员 问题 的 解 空间 树 


对 于 图 5-2 中 的 图 G, 回 溯 法 找 最 小 费用 周游 路 线 时 ,从 解 空 间 树 的 根 结 点 A 出 发 , 搜 
索 至 B,C,F,L。 在 叶 结 点 L 处 记录 找到 的 周游 路 线 1,2,3,4,1, 该 周游 路 线 的 费用 为 59。 
从 叶 结 点 工 返 回 至 最 近 活 结 点 下 处。 由 于 下 处 已 没有 可 扩展 结 点 ,算法 又 返回 到 结 点 C 
处 。 结 点 C 成 为 新 扩展 结 点 ,由 新 扩展 结 点 ,算法 再 移 至 结 点 G 后 又 移 至 结 点 M, 得 到 周游 
路 线 1,2,4,3,1, 其 费用 为 66。 这 个 费用 不 比 已 有 周游 路 线 1,2,3,4,1 的 费用 更 小 ,因此 ， 
舍弃 该 结 点 。 算 法 又 依次 返回 至 结 点 G,C,B。 从 结 点 B, 算 法 继续 搜索 至 结 点 D,H,N。 
在 叶 结 点 N 处 ,相应 的 周游 路 线 1,3,2,4,1 的 费用 为 25, 它 是 当前 找到 的 最 好 的 一 条 周游 
路 线 。 从 结 点 N 算法 返回 至 结 点 H,D, 然 后 从 结 点 D 开始 继续 向 纵深 搜索 至 结 点 O。 依 
此 方式 算法 继续 搜索 遍 整 个 解 空间 ,最终 得 到 最 小 费用 周游 路 线 1,3,2,4,1。 

回溯 法 搜索 解 空间 树 时 ,通常 采用 两 种 策略 避免 无 效 搜索 ,提高 回溯 法 的 搜索 效率 。 其 
一 是 用 约束 函数 在 扩展 结 点 处 前 去 不 满足 约束 的 子 树 ; 其 二 是 用 限界 函数 前 去 得 不 到 最 优 
解 的 子 树 。 这 两 类 函数 统称 为 剪 枝 函 数 。 

例如 , 解 0-1 背包 问题 回溯 法 用 剪 枝 函 数 剪 去 导致 不 可 行 解 的 子 树 。 在 解 旅行 售货员 
问题 的 回溯 法 中 ,如 果 从 根 结 点 到 当前 扩展 结 点 处 的 部 分 周游 路 线 费用 已 超过 当前 找到 的 
最 好 的 周游 路 线 费 用 , 则 可 以 断定 以 该 结 点 为 根 的 子 树 中 不 含 最 优 解 ,因此 ,可 以 将 该 子 树 
剪 去 。 

综 上 所 述 ,用 回溯 法 解 题 通常 包含 以 下 3 个 步骤 : 

(1) 针对 所 给 问题 ,定义 问题 的 解 空间 。 

(2) 确定 易于 搜索 的 解 空间 结构 。 

(3) 以 深度 优先 方式 搜索 解 空间 ,并 在 搜索 过 程 中 用 剪 枝 函 数 避 免 无 效 搜索 。 


5.1.3 递归 回 测 
回溯 法 对 解 空 间 进行 深度 优先 搜索 ,因此 ,在 一 般 情 况 下 可 用 递归 方法 实现 回溯 法 。 


Cn 
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void backtrack (int t) 
{ 
if (t>n) output(x); 


else 
for (int i=f(n,t);i<—g(n,t);it++) 
{ 
x[tj=h(D; 


证 (constraint(t) & &bound(t)) backtrack(t+1); 
} 
} 


其 中 ,形式 参数 1 表示 递归 深度 , 即 当 前 扩展 结 点 在 解 空间 树 中 的 深度 。n 用 来 控制 递 
归 深 度 。 当 tn 时 ,算法 已 搜索 至 叶 结 点 。 此 时 ,由 output(z) 记录 或 输出 得 到 的 可 行 解 
Ze。 算法 backtrack 的 for 循环 中 f(n,t) 和 g(n,t) 分 别 表 示 在 当前 扩展 结 点 处 未 搜索 过 的 
子 树 的 起 始 编号 和 终止 编号 。h (i) 表 示 在 当前 扩展 结 点 处 xz[t] 的 第 i 个 可 选 值 。 
constraint(1) 和 bound(z) 是 当前 扩展 结 点 处 的 约束 函数 和 限界 函数 。constraint(1) 返 回 的 
值 为 true 时 ,在 当前 扩展 结 点 处 xz[1: 相 取 值 满足 问题 的 约束 条 件 ; 否 则 ,不 满足 问题 的 约束 
条 件 ,可 剪 去 相应 的 子 树 。bound(2) 返 回 的 值 为 true 时 ,在 当前 扩展 结 点 处 xz[1: 想 取 值 未 
使 目标 函数 越界 ,还 需 由 backtrack(t 十 1) 对 其 相应 的 子 树 进一步 搜索 。 否 则 ,当前 扩展 结 
点 处 zLl: 妇 的 取 值 使 目标 函数 越界 ,可 剪 去 相应 的 子 树 。 执 行 了 算法 的 for 循环 后 ,已 搜索 
遍 当 前 扩展 结 点 的 所 有 未 搜索 过 的 子 树 。backtrack(7) 执 行 完毕 ,返回 1 一 1 层 继续 执行 ,对 
还 没有 测试 过 的 xz[1 一 1] 的 值 继续 搜索 。 当 1==1 时 , 若 已 测试 完 xz[1] 的 所 有 可 选 值 ,外 层 
调用 就 全 部 结束 。 显 然 , 这 一 搜索 过 程 按 深度 优先 方式 进行 。 调 用 一 次 backtrack(1) 即 可 
完成 整个 回溯 搜索 过 程 。 


5.1.4 和 闪 代 回 测 
采用 树 的 非 递归 深度 优先 遍历 算法 ,可 将 回溯 法 表示 为 一 个 非 递 归 和 迭代 过 程 。 


void iterativeBacktrack () 
int t=1; 
while (t>0) 
t 
if (fn,t)<=g(n,t)) 
for (int i=f(n,t);i<—=g(n,t);it+) 
{ 
x[t]=h(); 
if (constraint(t) & &.bound(t)) 
{ 
if (solution(t)) output(x); 
else t 十 十 ; 


else t 一 一 3 
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} 


上 述 迭 代 回 溯 算 法 中 ,solution(z) 判 断 在 当前 扩展 结 点 处 是 否 已 得 到 问题 的 可 行 解 。 
它 返 回 的 值 为 true 时 ,在 当前 扩展 结 点 处 x[1: 相 是 问题 的 可 行 解 。 此 时 ,由 output(zx) 记录 
或 输出 得 到 的 可 行 解 。 它 返回 的 值 为 false 时 ,在 当前 扩展 结 点 处 x[1: 相 只 是 问题 的 部 分 
解 , 还 需 向 纵深 方向 继续 搜索 。 算 法 中 f(n,t) 和 gn,) 分 别 表示 在 当前 扩展 结 点 处 未 搜索 
过 的 子 树 的 起 始 编 号 和 终止 编号 。h( 让 表示 在 当前 扩展 结 点 处 z[] 的 第 i 个 可 选 值 。 
constraint(t) 和 bound(z) 是 当前 扩展 结 点 处 的 约束 函数 和 限界 函数 。constraint(1) 返 回 的 
值 为 true 时 ,在 当前 扩展 结 点 处 xz[1: 妇 取 值 满足 问题 的 约束 条 件 ; 否 则 ,不 满足 问题 的 约束 
条 件 , 可 前 去 相应 的 子 树 。bound(z) 返 回 的 值 为 true 时 ,在 当前 扩展 结 点 处 xz[1:]j] 取 值 未 
使 目标 函数 越界 ,还 需 对 其 相应 的 子 树 进 一 步 搜索 。 否 则 ,当前 扩展 结 点 处 xz[1: 想 取 值 使 
目标 函数 越界 ,可 剪 去 相应 的 子 树 。 算 法 的 while 循环 结束 后 ,完成 整个 回溯 搜索 过 程 。 

用 回溯 法 解 题 的 一 个 显著 特征 是 在 搜索 过 程 中 动态 产生 问题 的 解 空间 。 在 任何 时 刻 ， 
算法 只 保存 从 根 结 点 到 当前 扩展 结 点 的 路 径 。 如 果 解 空间 树 中 从 根 结 点 到 叶 结 点 的 最 长 路 
径 的 长 度 为 h(n) , 则 回溯 法 所 需 的 计算 空间 通常 为 O(h(n))。 而 显 式 地 存储 整个 解 空间 则 
需要 OC2*" ) 或 OU(m)1) 内 存 空 间 。 


5.1.5 子 集 树 与 排列 树 


图 5-1 和 图 5-3 中 的 两 棵 解 空间 树 是 用 回溯 法 解 题 时 常 遇 到 的 两 类 典型 的 解 空 间 树 。 

当 所 给 的 问题 是 从 个 元 素 的 集合 S 中 找 出 S 满足 某 种 性 质 的 子 集 时 ,相应 的 解 空间 
树 称 为 子 集 树 。 例 如 ,n 个 物品 的 0-1 背包 问题 所 相应 的 解 空间 树 是 一 棵 子 集 树 ,这 类 子 集 
树 通常 有 2" 个 叶 结 点 ,其 结 点 总 个 数 为 2 一 一 1。 遍 历 子 集 树 的 算法 需 2(2") 计 算 时 间 。 

当 所 给 问题 是 确定 n 个 元 素 满 足 某 种 性 质 的 排列 时 ,相应 的 解 空 间 树 称 为 排列 树 。 排 
列 树 通常 有 24 个 叶 结 点 。 因 此 ,遍历 排列 树 需要 QCn1) 计 算 时 间 。 图 5-3 中 旅行 售货员 问 
题 的 解 空间 树 是 一 棵 排列 树 。 

用 回溯 法 搜索 子 集 树 的 一 般 算法 可 描述 如 下 : 

void backtrack (int t) 

{ 

if (t>n) output(x); 
else 

for (int i=0;i<=1;i++) 

{ 
x[t]=i; 
if (constraint(t) & &bound(t)) backtrack(t+1); 

} 

} 


用 回溯 法 搜索 排列 树 的 算法 框架 可 描述 如 下 : 


void backtrack (int t) 
{ 
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if (t>n) output(x); 
else 

for (int i 一 tii< 一 nji 十 十 ) 

{ 
swap(x[t], x[i]); 
if (constraint(t) & &bound(t)) backtrack(t+1); 
swap(x[Lt], x[i]); 

} 

} 


在 调用 backtrack (1) 执行 回溯 搜索 之 前 , 先 将 变量 数组 x 初始 化 为 单位 排列 
(1,2,° ,72) 。 


5.2 装载 问题 


第 4 章 讨 论 了 最 优 装载 问题 的 贪心 算法 。 本 节 讨 论 最 优 装载 问题 的 一 个 变形 。 

1. 问题 描述 

有 一 批 共 个 集装箱 要 装 上 两 条 载重 量 分 别 为 cl 和 cs 的 轮船 ,其 中 ,集装箱 i 的 重量 
为 w;, 且 Dw 二 8 

装载 问题 要 求 确定 是 否 有 一 个 合理 的 装载 方案 可 将 这 个 集装箱 装 上 这 两 艘 轮船 。 如 
果 有 , 找 出 一 种 装载 方案 。 

例如 , 当 n=3,c 二 cs 二 50, 且 w= 二 [10,40,40], 可 将 集装箱 1 和 集装箱 2 装 上 第 一 般 轮 
船 , 而 将 集装箱 3 装 上 第 二 笨 轮 船 ;如 果 ww 二 [20,40,40], 则 无 法 将 这 3 个 集装箱 都 装 上 
轮船 。 


n 


当 >)rwi = a 十 cz 时 ,装载 问题 等 价 于 子 集 和 问题 。 当 c=cs 且 2》)w; = 2c 时 ,装载 


i=1 


问题 等 价 于 划分 问题 。 

即使 限制 wi; ,i 二 1,…,n 为 整数 ,c 和 cs 也 是 整数 。 子 集 和 问题 与 划分 问题 都 是 NP 难 
的 。 由 此 可 知 , 装 载 问题 也 是 NP 难 的 。 

容易 证 明 , 如 果 一 个 给 定 装载 问题 有 解 , 则 采用 下 面 的 策略 可 得 到 最 优 装载 方案 : 

(1) 首先 将 第 一 艘 轮船 尽 可 能 装 满 。 

(2) 将 剩余 的 集装箱 装 上 第 二 条 轮船 。 

将 第 一 盘 轮 船 尽 可 能 装 满 等 价 于 选取 全 体 集 装 箱 的 一 个 子 集 , 使 该 子 集 中 集装箱 重量 
之 和 最 接近 c, 。 由 此 可 知 ,装载 问题 等 价 于 以 下 特殊 的 0-1 背包 问题 。 


Xi€1{0,1}, li<n 
当然 可 以 用 第 3 章 中 讨论 过 的 动态 规划 算法 解 这 个 特殊 的 0-1 背包 问题 。 所 需 的 计算 
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时 间 是 OC(min{c ,2"})。 下 面 讨 论 用 回溯 法 设计 解 装载 问题 的 0(2") 计 算 时 间 算 法 。 在 某 
些 情况 下 该 算法 优 于 动态 规划 算法 。 

2. 算法 设计 

用 回溯 法 解 装载 问题 时 ,用 子 集 树 表 示 其 解 空间 显然 是 最 合适 的 。 可 行 性 约束 函数 可 


剪 去 不 满足 约束 条 件 Du 三 a 的 子 树 。 在 子 集 树 的 第 j 十 1 层 结 点 Z 处 ,用 cw 记 当 前 


的 装载 重量 , 即 cw = Du , 当 cw>cl 时 ,以 结 点 Z 为 根 的 子 树 中 所 有 结 点 都 不 满足 约 


束 条 件 , 因 而 该 妈 子 树 中 的 解 均 为 不 可 行 解 ， 故 可 将 该 子 树 剪 去 。 

下 面 的 解 装载 问题 的 回溯 法 中 ,方法 maxLoading 返回 不 超过 c 的 最 大 子 集 和 ,但 未 给 
出 达到 这 个 最 大 子 集 和 的 相应 子 集 。 稍 后 加 以 完善 。 

算法 maxLoading 调用 递归 方法 backtrack(1) 实 现 回 溯 搜 索 。backtrack(i) 搜 索 子 集 树 
中 第 i 层 子 树 。 类 Loading 的 数据 成 员 记 录 子 集 树 中 结 点 信息 ,以 减少 传 给 backtrack 的 参 
数 。cw 记录 当前 结 点 相应 的 装载 重量 ,bestw 记录 当前 最 大 装载 重量 。 

在 算法 backtrack 中 , 当 i>n 时 ,算法 搜索 至 叶 结 点 ,其 相应 的 装载 重量 为 cw。 如 果 
cw 二 bestw, 则 表示 当前 解 优 于 当前 最 优 解 ,此 时 应 更 新 bestw。 

当 i<n 时 ,当前 扩展 结 点 Z 是 子 集 树 的 内 部 结 点 。 该 结 点 有 x[ 门 =1 和 x[ 门 ==0 两 个 
儿子 结 点 。 其 左 儿 子 结 点 表示 x[ 门 =1 的 情形 , 仅 当 cw 十 w[ 门 才 c 时 进入 左 子 树 ,对 左 子 
树 递归 搜索 。 其 右 儿 子 结 点 表示 z[ 门 =0 的 情形 。 由 于 可 行 结 点 的 右 儿 子 结 点 总 是 可 行 
的 , 故 进入 右 子 树 时 不 需 检查 可 行 性 。 

算法 backtrack 动态 地 生成 问题 的 解 空间 树 。 在 每 个 结 点 处 算法 花费 O(1) 时 间 。 子 集 
树 中 结 点 个 数 为 0(2") , 故 backtrack 所 需 的 计算 时 间 为 O(2")。 另 外 backtrack 还 需要 额 
外 的 O(Cz) 递 归 栈 空间 。 

具体 算法 描述 如 下 : 

public class Loading 

{ 


// 类 数据 成 员 

static int n; // 集 装 箱 数 

static int [] w; // 集 装 箱 重量 数组 
static int cy // 第 一 稻 轮 船 的 载重 量 
static int cws; // 当 前 载重 量 

static int bestw; // 当 前 最 优 载重 量 


public static int maxLoading (int [] ww, int cc) 
和 

// 初 始 化 类 数据 成 员 

n=ww. length 一 1; 

ww 一 wwi 

c 一 cc 

cw=0; 


bestw=0; 
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// 计 算 最 优 载重 量 
backtrack(1); 
return bestw; 


} 


// 回 溯 算 法 
private static void backtrack (int i) 
{// 搜 索 第 i 层 结 点 

if (>m 

{// 到 达 叶 结 点 
if (cw>bestw) bestw=cw; 
return; 

} 

// 搜 索 子 树 

让 (cw 十 w[ 店 < 一 c) 

{// 搜 索 左 子 树 , 即 x[i== 1 
cw++=w[i]; 
backtrack(i 十 1)， 
cw—=w[i]; 

backtrack(i 十 1); ”// 搜 索 右 子 树 

} 
» 


3. 上 界 函 数 

对 于 前 面 描述 的 算法 backtrack ,还 可 引入 一 个 上 界 函 数 ,用 于 剪 去 不 含 最 优 解 的 子 树 ， 
从 而 改进 算法 在 平均 情况 下 的 效率 。 设 Z 是 解 空间 树 第 i 层 上 的 当前 扩展 结 点 。cw 是 当 
前 载重 量 ;bestw 是 当前 最 优 载重 量 ;r 是 剩余 集装箱 的 重量 , 即 ~= 》) rw 。 定 义 上 界 函 数 

= 计 1 

为 cw 十 r。 在 以 Z 为 根 的 子 树 中 任 一 叶 结 点 所 相应 的 载重 量 均 不 超过 cw 十 rr。 因此, 当 
cw 十 r 委 bestw 时 ,可 将 Z 的 右 子 树 剪 去 。 

在 下 面 的 改进 算法 中 ,引入 类 Loading 的 变量 ~, 用 于 计算 上 界 函 数 。 引 入 上 界 函 数 
后 ,在 达到 叶 结 点 时 就 不 必 再 检查 该 叶 结 点 是 否 优 于 当前 最 优 解 ,因为 上 界 函 数 使 算法 搜索 
到 的 每 个 叶 结 点 都 是 当前 找到 的 最 优 解 。 虽 然 改 进 后 的 算法 的 计算 时 间 复 杂 人 性 仍 为 
O(2") ,但 在 平均 情况 下 改进 后 算法 检查 的 结 点 数 较 少 。 

改进 后 的 算法 描述 如 下 : 


public class Loading 
{ 


// 类 数据 成 员 

static int ni // 集 装 箱 数 

static int [] ws // 集 装 箱 重量 数组 
static int cs // 第 一 艘 轮船 的 载重 量 
static int cwi // 当 前 载重 量 


static int bestw; // 当 前 最 优 载 重量 


static int r; // 剩 余 集装箱 重量 


public static int maxLoading (int [] ww, int cc) 
{ 

// 初 始 化 类 数据 成 员 

n 一 ww. length 一 1; 

ww 一 wwi; 

Cc 一 cc 

cw 一 0 

bestw=0; 

r=0; 

// 初 始 化 

for (int i=1; i<=n; i 十 十 ) 

r+=w[i]; 


// 计 算 最 优 载 重量 
backtrack(1); 
return bestw; 


// 回 溯 算 法 
private static void backtrack (int i) 
{// 搜 索 第 i 层 结 点 
if (>m 
{// 到 达 叶 结 点 
if (cw>bestw) bestw 一 cwi; 
return; 
} 
// 搜 索 子 树 
r—=w[i]; 
if (ew+w[i]<=0) 
{// 搜 索 左 子 树 
cwt=w[i]; 
backtrack(i+1); 
cw—=w[i]; 
} 
让 (cw 十 r>bestw) ”// 搜 索 右 子 树 
backtrack(i+1); 
r+=w[i]; 


} 
4. 构造 最 优 解 
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为 了 构造 最 优 解 ,必须 在 算法 中 记录 与 当前 最 优 值 相应 的 当前 最 优 解 。 为 此 ,在 类 
Loading 中 增加 两 个 私有 数据 成 员 x 和 bestx,x 用 于 记录 从 根 至 当前 结 点 的 路 径 ,bestx 记 
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录 当 前 最 优 解 。 算 法 搜索 到 达 叶 结 点 处 ,就 修正 bestx 的 值 。 
进一步 改进 后 的 算法 描述 如 下 : 


public class Loading 
{ 


// 类 数据 成 员 

static int n; // 集 装 箱 数 

static int [] w; // 集 装 箱 重量 数组 
static int cs // 第 一 般 轮 船 的 载重 量 
static int cws; // 当 前 载重 量 

static int bestw; // 当 前 最 优 载重 量 
static int r; // 剩 余 集装箱 重量 
static int [] x; // 当 前 解 

static int [] bestx; // 当 前 最 优 解 


public static int maxLoading (int [] ww, int ce, int [] xx) 
{ 

// 初 始 化 类 数据 成 员 

n 一 ww. length 一 1; 

W=ww; 

c 一 ccj 

cw 一 0; 

bestw=0; 

x 一 new int[n 十 1]; 


bestx=xx; 


// 初 始 化 
for (int i=1; i<= n; i 十 十 ) 
r+=w[i]; 


// 计 算 最 优 载 重量 
backtrack(1); 
return bestw; 


} 


// 回 潮 算 法 
private static void backtrack (int i) 
{// 搜 索 第 i 层 结 点 
if (i>m 
{// 到 达 叶 结 点 
if (cw>bestw) 
{ 
for (int j=1; j<=n; j++) 
bestx[j]=x[i]; 


bestw 一 cwi; 
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return; 


} 


// 搜 索 子 树 
r 一 一 w[i]; 
if Ccw 十 w[ 口 < 一 c) 
{// 搜 索 左 子 树 
i=1 
cw+t+=w[i]; 
backtrack(i+1); 
cw—=w[i]; 
F 
if (cwt+r>bestw) 
{ 
x[ 让 二 0;”// 搜 索 右 子 树 
backtrack(i 十 1); 
} 
r+=w[i]; 
} 
由 于 bestx 可 能 被 更 新 0(2") 次 ,改进 后 算法 的 计算 时 间 复 杂 性 为 O(n2")。 
下 面 的 两 种 策略 可 使 改进 后 算法 的 计算 时 间 复 杂 性 减 至 O(2”)。 
(1) 先 运 行 只 计算 最 优 值 的 算法 ,计算 出 最 优 装 载 量 W。 由 于 该 算法 不 记录 最 优 解 , 故 
所 需 的 计算 时 间 为 0(2")。 然 后 运行 改进 后 的 算法 backtrack, 并 在 算法 中 将 bestw 置 为 
W。 在 首次 到 达 的 叶 结 点 处 ( 即 首 次 遇 到 i>n 时 ) 终 止 算法 。 由 此 返回 的 bestx 即 为 最 
优 解 。 
(2) 另 一 种 策略 是 在 算法 中 动态 地 更 新 bestx。 在 第 i 层 的 当前 结 点 处 ,当前 最 优 解 由 
ZX[ 让 ,1 二 j<i 和 bestx[ 站 ,ij 过 n 组 成 。 每 当 算法 回溯 一 层 , 将 x[ 门 存 人 bestx[ 让 。 这样 
在 每 个 结 点 处 更 新 bestx 只 需 O(1) 时 间 , 从 而 整个 算法 中 更 新 bestx 所 需 的 时 间 为 O(2") 。 
5. 迭代 回 淹 
数组 z 记录 了 解 空 间 树 中 从 根 到 当前 扩展 结 点 的 路 径 , 这 些 信 息 已 包含 了 回溯 法 在 回 
溯 时 所 需 信息 。 因 此 利用 数组 x 所 含 信息 ,可 将 上 述 回溯 法 表示 成 非 递归 形式 ,由 此 可 进 
一 步 省 去 OC2) 递 归 栈 空间 。 解 装载 问题 的 非 递归 迭代 回溯 法 maxLoading 描述 如 下 : 
public static int maxLoading (int [] w, int c，int [] bestx) 
{  // 和 迭代 回溯 法 
// 返 回 最 优 载重 量 及 其 相应 解 
// 初 始 化 根 结 点 
int i 二 1; // 当 前 层 
int n 一 w. length 一 1; 


int [] x=new intLn 十 ]]; //x[1:i 一 1] 为 当前 路 径 


int bestw 一 0; // 当 前 最 优 载重 量 
int cw 一 0; // 当 前 载重 量 


int r=0; // 剩 余 集装箱 重量 


算法 设计 与 分 折 ( 艇 工厂 ) 


for (int j=1; j<=n; j 十 十 ) 
r 十 一 wDj]; 
// 搜 索 子 树 
while (true) 
{ 
while (i<—n && cw 十 w[ 让 < 一 c) 


{// 进 入 左 子 树 
r—=w[i]; 


t=w[i]; 


if (i>m 
{// 到 达 叶 结 点 
for (int j=1; j<=n; j++) 
bestx[j]= x[j]， 
bestw=cw; 
} 
else 
{// 进 入 右 子 树 
r—=w[i]; 
x[i]=0; 
让 和 
while (cw + r < 一 bestw) 
{// 剪 枝 回溯 
Yh 
while (i>0 && x[]== 0) 
{// 从 右 子 树 返回 
r+=w[i]; 
和 
} 
if (i==0) return bestw; 
// 进 入 右 子 树 
x[i]= 0; 
cw—=w[i]; 


ma 


} 
算法 maxLoading 所 需 的 计算 时 间 仍 为 0(2”)。 


5.3 批 处 理 作 业 调 度 


1. 问题 描述 
给 定 nn 个 作业 的 集合 本 二 { 卫 ,J:,…,J，)。 每 一 个 作业 J; 都 有 两 项 任务 分 别 在 两 台 


回 淘 法 


器 上 完成 。 每 个 作业 必须 先 由 机 器 1 处 理 , 然 后 由 机 器 2 处 理 。 作 业 J; 需要 机 器 j 的 处 理 
时 间 为 ,其 中 i 二 1,2,…,n, Jj 二 1,2。 对 于 一 个 确定 的 作业 调度 , 设 F; 是 作业 i 在 机 器 j 


上 完成 处 理 的 时 间 。 所 有 作业 在 机 器 2 上 完成 处 理 的 时 间 和 f= Dy 称 为 该 作业 调度 的 


完成 时 间 和 。 

批 处 理 作 业 调 度 问题 要 求 对 于 给 定 的 个 作业 ,制定 最 佳作 业 调 度 方案 ,使 其 完成 时 间 
和 达到 最 小 。 

批 处 理 作 业 调度 问题 的 一 个 常见 例子 是 在 计算 机 系统 中 完成 一 批 n 个 作业 ,每 个 作业 
都 先 完成 计算 ,然后 将 计算 结果 打印 输出 。 计 算 任务 由 计算 机 的 中 央 处 理 器 完成 ,打印 输出 
任务 由 打印 机 完成 。 在 这 种 情形 下 ,计算 机 的 中 央 处 理 器 是 机 器 1, 打 印 机 是 机 器 2。 

对 于 批 处 理 作业 调度 问题 ,可 以 证 明 ,存在 最 佳作 业 调 度 使 得 在 机 器 1 和 机 器 2 上 作业 
以 相同 次 序 完成 。 

例如 ,考虑 如 下 "一 3 的 实例 : 


ti 机 器 1 机 器 2 
作业 1 有 
作业 2 3 
作业 3 2 3 


这 3 个 作业 的 6 种 可 能 的 调度 方案 是 1,2,3;1,3,2;2,1,3;2,3,1;3,1,2;3,2,1; 它 们 
所 对 应 的 完成 时 间 和 分 别 是 19,18,20,21,19,19。 显 而 易 见 ,最 佳 调度 方案 是 1,3,2, 其 完 
成 时 间 和 为 18。 

2. 算法 设计 

批 处 理 作业 调度 问题 要 从 个 作业 的 所 有 排列 中 找 出 有 最 小 完成 时 间 和 的 作业 调度 ， 
所 以 批 处 理 作业 调度 问题 的 解 空 间 是 一 棵 排列 树 。 按 照 回 溯 法 搜索 排列 树 的 算法 框架 , 设 
开始 时 z= 二 [1,2,… ,nj 是 所 给 的 个 作业 , 则 相应 的 排列 树 由 z[1 :站 的 所 有 排列 构成 。 

类 FlowShop 的 数据 成 员 记录 解 空间 中 结 点 信息 ,以 减少 传 给 backtrack 的 参数 。 二 维 
数组 m 是 输入 的 作业 处 理 时 间 。bestf 记录 当前 最 小 完成 时 间 和 ,bestx 是 相应 的 当前 最 佳 
作业 调度 。 

在 递归 方法 backtrack 中 , 当 i>n 时 ,算法 搜索 至 叶 结 点 ,得 到 一 个 新 的 作业 调度 方案 。 
此 时 算法 适时 更 新 当前 最 优 值 和 相应 的 当前 最 佳作 业 调 度 。 

当 i<n 时 ,当前 扩展 结 点 位 于 排列 树 的 第 i 一 1 层 。 此 时 算法 选择 下 一 个 要 安排 的 作 
业 , 以 深度 优先 的 方式 递归 地 对 相应 子 树 进行 搜索 。 对 于 不 满足 上 界 约束 的 结 点 , 则 剪 去 相 
应 的 子 树 。 

批 处 理 作 业 调 度 问 题 的 回溯 算法 描述 如 下 : 


public class FlowShop 
{ 


static int ny // 作 业 数 
所， // 机 器 1 完成 处 理 时 间 
f, // 完 成 时 间 和 


bestf; // 当 前 最 优 值 
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算法 设计 与 分 折 ( 蓄 工厂 ) 


static int [][] ms 
static int [] xs 
static int [] bestx; 
static int [] {2; 


// 各 作业 所 需 的 处 理 时 间 
// 当 前 作业 调度 

// 当 前 最 优 作业 调度 

// 机 器 2 完成 处 理 时 间 


private static void backtrack(int i) 
{ 
i (>m 
{ 
for (int j=1; j< 一 pn; j 十 十 ) 
bestx[j]= x[j]; 
bestf=f; 
} 
else 
for (int j=i; j<=n; j++) 
{ 
和 十 一 m[x[j]][1]， 
f2[i]=((f2[i—1]>f1)? f2[i—1]:f1)+m[x[j]]J[2]; 
f+=f2[i]; 
if ({<bestf) 
{ 
MyMath. swap(Cxyi,j); 
backtrack(i 十 1); 
MyMath. swap(xyi,j); 
} 
全 一 一 m[x[j]][1]， 
f{—=f2[i]; 
} 
} 


3. 算法 效率 


由 于 算法 backtrack 在 每 一 个 结 点 处 耗费 O(1) 计 算 时 间 , 故 在 最 坏 情况 下 ,整个 算法 的 


计算 时 间 复 杂 性 为 O(n1)。 


5.4 符号 三 角形 问题 


1. 问题 描述 

图 5-4 是 由 14 个 “十 ”号 和 14 个 “一 ”号 组 成 的 符号 
三 角形 。 两 个 同 号 下 面 都 是 “十 ”号 ,两 个 异 号 下 面 都 是 
“一 ”号 。 

在 一 般 情况 下 ,符号 三 角形 的 第 一 行 有 个 符 
号 。 符 号 三 角形 问题 要 求 对 于 给 定 的 mn, 计算 有 多 少 
个 不 同 的 符号 三 角形 ,使 其 所 含 的 “十 ”和 “一 ”的 个 数 
相同 。 


图 5-4 符号 三 角形 


2. 算法 设计 

对 于 符号 三 角形 问题 ,用 nn 元 组 zx[1:n] 表 示 符 号 三 角形 的 第 一 行 的 n 个 符号 。 当 
z[ 可 =1 时 ,表示 符号 三 角形 的 第 一 行 的 第 i 个 符号 为 “十 ”; 当 zx[ 门 =0 时 ,表示 符号 三 角形 
的 第 一 行 的 第 i 个 符号 为 “一 ”;1<i<n。 由 于 z[ 疏 是 2 值 的 ,所 以 在 用 回溯 法 解 符 号 三 角 
形 问 题 时 ,可 以 用 一 棵 完全 二 又 树 来 表示 其 解 空 间 。 在 符号 三 角形 的 第 一 行 的 前 i 个 符号 
ZZ[1: 疏 确定 后 ,就 确定 了 一 个 由 iX (i 十 1)/2 个 符号 组 成 的 符号 三 角形 。 下 一 步 确定 x[i 十 
1] 的 值 后 ,只 要 在 前 面 已 确定 的 符号 三 角形 的 右边 加 一 条 边 ,就 可 以 扩展 为 xz[1:i 十 1] 所 相 
应 的 符号 三 角形 。 最 终 由 z[1:n] 所 确定 的 符号 三 角形 中 包含 的 “十 ”个 数 与 “一 ”个 数 同 为 
nX(n 十 1)/4。 因 此 在 回溯 搜索 过 程 中 可 用 当前 符号 三 角形 所 包含 的 “十 "个 数 与 “一 ”个 数 
均 不 超过 nX(n 十 1)/4 作为 可 行 性 约束 ,用 于 剪 去 不 满足 约束 的 子 树 。 对 于 给 定 的 n, 当 
nX (n 十 1)/2 为 奇数 时 ,显然 不 存在 所 包含 的 “十 ”个 数 与 一 ”个 数 相 同 的 符号 三 角形 。 这 
种 情况 可 以 通过 简单 的 判断 加 以 处 理 。 

下 面 的 解 符号 三 角形 问题 的 回溯 法 中 ,递归 方法 backtrack(1) 实 现 对 整个 解 空 间 的 回 
漳 搜 索 。backtrack(i) 搜 索 解 空间 中 第 层 子 树 。 类 Triangle 的 数据 成 员 记录 解 空间 中 结 
点 信息 ,以 减少 传 给 backtrack 的 参数 。sum 记录 当前 已 找到 的 “十 ?个 数 与 “一 ”个 数 相同 
的 符号 三 角形 数 。 

在 算法 backtrack 中 , 当 i>n 时 ,算法 搜索 至 叶 结 点 ,得 到 一 个 新 的 “十 ”个 数 与 “一 ”个 
数 相同 的 符号 三 角形 ,当前 已 找到 符号 三 角形 数 sum 增 1。 

当 ;入 时 ,当前 扩展 结 点 Z 是 解 空间 中 的 内 部 结 点 。 该 结 点 有 z[ 疏 =1 和 x[ 门 =0 共 
两 个 儿子 结 点 。 对 当前 扩展 结 点 Z 的 每 一 个 儿子 结 点 ,计算 其 相应 的 符号 三 角形 中 “十 "个 
数 count 与 “一 ”个 数 , 并 以 深度 优先 的 方式 递归 地 对 可 行 子 树 搜索 ,或 前 去 不 可 行 子 树 。 

解 符 号 三 角形 问题 的 回溯 算法 描述 如 下 : 

public class Triangles 


{ 


static int ny // 第 一 行 的 符号 个 数 
half, // nx (nt+1)/4 
counts // 当 前 "十 "个 数 


static int [][] p; // 符 号 三 角形 矩阵 

static long sum; // 已 找到 的 符号 三 角形 数 
public static long compute (int nn) 
{ 

n=nn; 

count 一 0; 

Sum 一 0; 

half 一 nx (n+1)/2; 

if (half%2 一 一 1) return 0; 

half= half/2; 

p=new int [n 十 1] [n 十 1]; 

for (int i=0; i<—n; i 十 十 ) 

for (int j=0; j<=n; j 十 十 ) p[i0D]=0; 
backtrack(1); 


算法 说 计 与 分 折 ( 盘 工厂 ) 


return sum; 
private static void backtrack (int t) 
和 
if ((count>halD)||(t* (t—1)/2—count>half)) return; 
if (t>n) sum 十 十 ; 
else 
for (int i=0;i<2;i++) 
{ 
pL1J[t=i; 
count 十 一 i 
for (int j 一 25j< 一 tj 十 十 ) 
{ 
p[j][t 一 十 二 一 pD 一 J][t 一 ji 十 1]-pD 一 匡 [t 一 ji 十 2]; 
count 十 一 p[j][t 一 j 十 1]， 
} 
backtrack(t 十 1); 
for (int j 王 23j< 一 tj 十 十 ) 
count 一 一 p[j][t 一 j 十 1] 


count—=i; 


} 
} 


3. 算法 效率 
计算 可 行 性 约束 需要 OCz) 时 间 ,在 最 坏 情 况 下 有 O(2") 个 结 点 需要 计算 可 行 性 约束 ， 
故 解 符号 三 角形 问题 的 回溯 算法 backtrack 所 需 的 计算 时 间 为 OCz2") 。 


5.5 nn 后 问题 


1. 问题 描述 

在 nXn 格 的 棋盘 上 放置 彼此 不 受 攻击 的 n 个 皇后 。 按 照 国 际 象棋 的 规则 ,皇后 可 以 攻 
击 与 之 处 在 同一 行 或 同一 列 或 同一 斜 线 上 的 棋子 。n 后 问题 等 价 于 在 n Xn 格 的 棋盘 上 放 
置 n 个 皇后 ,任何 2 个 皇后 不 放 在 同一 行 或 同一 列 或 同一 斜 线 上 。 

2. 算法 设计 

用 元 组 z[1:n] 表 示 nn 后 问题 的 解 。 其 中 zx[ 让 表示 皇后 i 放 在 棋盘 的 第 i 行 的 第 
并 [可 列 。 由 于 不 允许 将 2 个 皇后 放 在 同一 列 , 所 以 解 向 量 中 的 xz[ 门 互 不 相同 。2 个 皇后 不 
能 放 在 同一 斜 线 上 是 问题 的 隐约 束 。 对 于 一 般 的 后 问题 ,这 一 隐约 束 条 件 可 以 化 成 显 约 
东 的 形式 。 将 nXn 格 棋盘 看 作 二 维 方 阵 ,其 行 号 从 上 到 下 , 列 号 从 左 到 右 依 次 编号 为 1， 
2,…,n。 从 棋盘 左上 角 到 右 下 角 的 主 对 角 线 及 其 平行 线 ( 即 斜率 为 一 1 的 各 斜 线 ) 上 ,2 个 
下 标 值 的 差 ( 行 号 一 列 号 ) 值 相等 。 同 理 , 斜 率 为 十 1 的 每 一 条 斜 线 上 ,2 个 下 标 值 的 和 ( 行 
号 十 列 号 ) 值 相等 。 因 此 , 若 2 个 皇后 放置 的 位 置 分 别 是 (i,7) 和 (k,1), 且 i 一 j 二 & 一 1 或 
i 十 j 二 k& 十 1, 则 说 明 这 2 个 皇后 处 于 同一 斜 线 上 。 以 上 2 个 方程 分 别 等 价 于 i 一 k= 二 j 一 ! 和 


i 一 二! 一 j。 由 此 可 知 ,只 要 |i 一 k| 二 1; 一 /| 成 立 , 就 表明 2 个 皇后 位 于 同一 条 斜 线 上 。 问 
题 的 隐约 束 化 成 了 显 约束 。 

用 回溯 法 解 n 后 问题 时 ,用 完全 nn 又 树 表 示 解 空间 。 可 行 性 约束 place 剪 去 不 满足 行 、 
列 和 和 斜 线 约束 的 子 树 。 

下 面 的 解 后 问题 的 回溯 法 中 ,递归 方法 backtrack(1) 实 现 对 整个 解 空间 的 回溯 搜索 。 
backtrack(iD 搜 索 解 空间 中 第 i 层 子 树 。 类 Queen 的 数据 成 员 记 录 解 空间 中 结 点 信息 ,以 减 
少 传 给 backtrack 的 参数 。sum 记录 当前 已 找到 的 可 行 方 案 数 。 

在 算法 backtrack 中 , 当 i>n 时 ,算法 搜索 至 叶 结 点 ,得 到 一 个 新 的 nn 皇后 互 不 攻击 放 
置 方案 ,当前 已 找到 的 可 行 方 案 数 sum 增 1 。 

当 i<n 时 ,当前 扩展 结 点 Z 是 解 空间 中 的 内 部 结 点 。 该 结 点 有 zx[ 门 =1,2,…,n, 共 n 
个 儿子 结 点 。 对 当前 扩展 结 点 Z 的 每 一 个 儿子 结 点 ,由 place 检查 其 可 行 性 ,并 以 深度 优先 
的 方式 递归 地 对 可 行 子 树 搜索 ,或 前 去 不 可 行 子 树 。 

解 后 问题 的 回溯 算法 描述 如 下 : 

public class NQueenl 

《 


static int nj // 皇 后 个 数 
static int [] xy // 当 前 解 
static long sum; // 当 前 已 找到 的 可 行 方案 数 


public static long nQueen (int nn) 
{ 
n=nn; 
sum=0; 
x 一 new int [nt+1]; 
for (int i=0; i<=n; i 十 十 ) x[i]=0; 
backtrack(1); 
return sum; 


private static boolean place (int k) 

{ 
for (int j=1;j<k;j 二 + 十) 
if ((Math. abs(k—j)== Math. abs(x[j]—x[k]))||(x[]== x[k])) return false; 
return true; 


’ 


private static void backtrack (int t) 
{ 
if (t>n) sum 十 十 
else 
for (int i 一 1;i< 一 nj;i 十 十 ) 
{ 
x[t]=i; 


算法 设计 与 分 折 ( 血 工厂 ) 


if (place(t)) backtrack(t 十 1); 
} 


站 


3. 迭代 回 淹 

数组 z 记录 了 解 空间 树 中 从 根 到 当前 扩展 结 点 的 路 径 , 这 些 信息 已 包含 了 回溯 法 在 回 
溯 时 所 需要 的 信息 。 利 用 数组 x 所 含 信息 ,可 将 上 述 回溯 法 表示 成 非 递 归 形 式 , 进 一 步 省 
去 O(n) 递 归 栈 空间 。 

解 导 后 问题 的 非 递归 迭代 回溯 法 backtrack 描述 如 下 : 


public class NQueen2 
{ 


static int n; // 皇 后 个 数 
static int [] x; // 当 前 解 
static long sum; // 当 前 已 找到 的 可 行 方案 数 


public static long nQueen (int nn) 
{ 
n=nn; 
sum=0; 
x=new int [nt+1]; 
for (int i=0; i<=n; i 十 十 ) x[i]=0; 
backtrack(); 


return sum; 


private static boolean place (int k) 
{ 
for (int j 王 1;j<<k;j 十 十 ) 
让 ((Math. abs(k—j)== Math. abs(x[j]—x[k]))||(x[j]== x[k])) return false; 


return true; 


private static void backtrack() 
{ 
x[1]=0; 
int k=1; 
while (k>0) 
{ 
x[k]+=1; 
while ((x[k]<=nm) 8&8& ! (place(k))) x[k] 十 一 1; 
if (x[k]<=n) 
if (k==n) sum 十 十 
else 


{ 


回 济 法 


5.6 0-1 背包 问题 


1. 算法 描述 

0-1 背包 问题 是 子 集 选 取 问 题 。 一 般 情况 下 ,0-1 背包 问题 是 NP 难 的 。0-1 背包 问题 
的 解 空间 可 用 子 集 树 表 示 。 解 0-1 背包 问题 的 回溯 法 与 装载 问题 的 回溯 法 十 分 类 似 。 在 搜 
索 解 空间 树 时 ,只 要 其 左 儿 子 结 点 是 一 个 可 行 结 点 ,搜索 就 进入 其 左 子 树 。 当 右 子 树 有 可 能 
包含 最 优 解 时 才 进 入 右 子 树 搜索 ;否则 将 右 子 树 剪 去 。 设 ~ 是 当前 剩余 物品 价值 总 和 ; cp 
是 当前 价值 ;bestp 是 当前 最 优 价值 。 当 cp 十 r 三 bestp 时 ,可 前 去 右 子 树 。 计 算 右 子 树 中 解 
的 上 界 的 更 好 方法 是 将 剩余 物品 依 其 单位 重量 价值 排序 ,然后 依次 装 和 人 物品 ,直至 装 不 下 
时 ,再 装 入 该 物品 的 一 部 分 而 装 满 背包 。 由 此 得 到 的 价值 是 右 子 树 中 解 的 上 界 。 

例如 ,对 于 0-1 背 包 问 题 的 一 个 实例 ,n=4,c=7,p 二 [9,10,7,4],w= 二 [3,5,2,1]。 这 4 
个 物品 的 单位 重量 价值 分 别 为 [3,2,3.5,4]。 以 物品 单位 重量 价值 的 递减 顺序 装 入 物品 。 
先 装 人 物品 4, 然后 装 入 物品 3 和 1。 装 入 这 3 个 物品 后 ,剩余 的 背包 容量 为 1, 只 能 装 入 
0.2 的 物品 2。 由 此 得 到 一 个 解 为 xz 二 [1,0.2,1,1], 其 相应 的 价值 为 22。 尽 管 这 不 是 一 个 
可 行 解 ,但 可 以 证 明 其 价值 是 最 优 值 的 上 界 。 因 此 ,对 于 这 个 实例 ,最 优 值 不 超过 22。 

为 了 便于 计算 上 界 , 可 先 将 物品 依 其 单位 重量 价值 从 大 到 小 排序 ,此 后 只 要 顺序 考查 各 

品 即 可 。 在 实现 时 ,由 bound 计算 当前 结 点 处 的 上 界 。 类 Knapsack 的 数据 成 员 记 录 解 

空间 树 中 的 结 点 信息 ,以 减少 参数 传递 以 及 递归 调用 所 需 的 栈 空间 。 在 解 空间 树 的 当前 扩 
展 结 点 处 , 仅 当 要 进入 右 子 树 时 才 计算 上 界 bound, 以 判断 是 否 可 将 右 子 树 前 去 。 进 入 左 子 
树 时 不 需 计 算 上 界 , 因 为 其 上 界 与 其 父 结 点 的 上 界 相 同 。 

解 0-1 背包 问题 的 回溯 算法 描述 如 下 : 

public class Knapsack 

{ 

private static class Element implements Comparable 
{ 
int id; // 物 品 编号 
double d; 


Private Element(int idd, double dd) 
{ 

id=idd; 

d=dd; 
} 


算法 设计 与 分 折 ( 艇 工厂) 


public int compareTo(Object x) 
{ 
double xd 一 ((Element) x). ds 
if (d<xd) return 一 1; 
if (d==xd) return 0; 


return 1; 


public boolean equals(Object x) 
{return d 一 一 ((Element) x). d;} 


static double c; // 背 包容 量 
static int nj // 物 品 数 

static double [] ws; // 物 品 重量 数组 
static double [] p; // 物 品 价值 数组 
static double cwi // 当 前 重量 
static double cp; // 当 前 价值 


static double bestp; // 当 前 最 优 价 值 


public static double knapsack(double [] pp, double [] ww, double cc) 
{ 

c 一 ccj 

n 一 pp. length 一 1; 

cw=0.0; 

cp=0.0; 

bestp=0.0; 


//q 为 单位 重量 价值 数组 


Element [] q= new Element [nj]; 


// 初 始 化 a[0:n 一 1] 
for (int i=1; i<=n; i 十 十 ) 
qg[i —1]=new Element(i, pp[i]/ww[i]); 


// 将 各 物品 依 单位 重量 价值 从 大 到 小 排序 
MergeSort. mergeSort(q); 


p=new double [n+1]; 
w=new double [n+1]; 
for (int i=1; i<= n; i 十 十 ) 
{ 
PLij=ppLaLn—il. id]; 
w[i]=wwLaqLn—il. id]; 


backtrack(1); // 回 溯 搜 索 
return bestp; 


} 


private static void backtrack(int i) 
{ 
if (i>m 
{// 到 达 叶 结 点 
bestp=cp; 


return; 


// 搜 索 子 树 

if (ew+w[i]<=e) 

{// 进 入 左 子 树 
cw++=w[i]; 
cp 十 一 pP[i， 
backtrack(i 十 1)， 
cw—=w[i]; 
cp—=p[i]; 

} 

if (bound(i+1)>bestp) 
backtrack(i 十 1); 。”// 进 入 右 子 树 


private static double bound(int i) 
{// 计 算 上 界 
double cleft=c 一 cw; ”// 剩 余 容量 
double bound = cp; 
// 以 物品 单位 重量 价值 递减 顺序 装 和 人 物品 
while (i<—=n && w[i]<= cleft) 
cleft—= w[i]; 
bound 二 = 二 p[ 订 ; 
证 十 


// 装 满 背包 
让 (i< 一 Do) 

bound 十 一 p[i 订 * cleft/w[i]; 
return bound; 


回 济 法 


算法 朗 计 与 分 析 ( 第 4 版 ) 


2. 算法 效率 
计算 上 界 需要 O(n) 时 间 , 在 最 坏 情况 下 有 OC2") 个 右 儿子 结 点 需要 计算 上 界 , 故 解 0-1 
背包 问题 的 回溯 算法 backtrack 所 需 的 计算 时 间 为 O(n2")。 


5.7 最 大 团 问题 


1. 问题 描述 

给 定 无 向 图 G=(V,E)。 如 果 UCV, 且 对 任意 u,v€EU 有 (u,v)EE, 则 称 U 是 G 的 完 
全 子 图 。G 的 完全 子 图 U 是 G 的 团 , 当 且 仅 当 U 不 包含 在 G 的 更 大 的 完全 子 图 中 。G 的 最 
大 团 是 指 G 中 所 含 顶点 数 最 多 的 团 。 

图 5-5(a) 的 无 向 图 G 中 , 子 集 {1,2} 是 G 的 大 小 为 2 的 完全 子 图 。 这 个 完全 子 图 不 是 
团 ,因为 它 被 G 的 更 大 的 完全 子 图 {1,2,5} 包 含 。{1,2,5} 是 G 的 最 大 团 。{1,4,5} 和 {2,3， 
5} 也 是 G 的 最 大 团 。 
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(b) 
图 5-5 无 向 图 G 及 其 补 图 G 


如 果 UCV 且 对 任意 u,v€EU 有 (u,v)E, 则 称 U 是 G 的 空子 图 。G 的 空子 图 U 是 G 
的 独立 集 当 上 且 仅 当 U 不 包含 在 G 的 更 大 的 空子 图 中 。G 的 最 大 独立 集 是 G 中 所 含 顶点 数 
最 多 的 独立 集 。 

对 于 任 一 无 向 图 G==(V,E) 其 补 图 G==(V1,E1) 定 义 为 : V1==V, 且 (u,v)EE1l 当 且 仪 
(u,v EE, 

图 5-5(a) 和 图 5-5Cb) 中 的 两 个 无 向 图 互 为 补 图 。{2,4} 是 G 的 空子 图 ,同时 也 是 G 的 
最 大 独立 集 。 虽然 {1,2) 是 G 的 空子 图 ,但 它 不 是 G 的 独立 集 , 因 为 它 包 含 在 G 的 空子 图 
{1,2,5} 中 。{1,2,5} 是 G 的 最 大 独立 集 。 

注意 ,如 果 U 是 G 的 完全 子 图 , 则 它 是 G 的 空子 图 ,反之 亦 然 。 因 此 ,G 的 团 与 6 的 独 
立 集 之 间 存 在 一 一 对 应 关系 。 特 别 地 ,U 是 G 的 最 大 团 当 且 仅 当 U 是 G 的 最 大 独立 集 。 

2. 算法 设计 

无 向 图 G 的 最 大 团 和 最 大 独立 集 问题 都 可 以 用 回溯 法 在 O(n2") 时 间 内 解决 。 图 G 的 
最 大 团 和 最 大 独立 集 问题 都 可 以 看 作 是 图 G 顶点 集 V 的 子 集 选取 问题 。 因 此 ,可 以 用 子 集 
树 表 示 问 题 的 解 空间 。 解 最 大 团 问题 的 回溯 法 与 解 装 载 问 题 的 回溯 法 十 分 类 似 。 设 当前 扩 
展 结 点 Z 位 于 解 空间 树 的 第 i 层 。 在 进入 左 子 树 前 ,必须 确认 从 顶点 i 到 已 选 入 的 顶点 集 
中 每 一 个 顶点 都 有 边 相 连 。 在 进入 右 子 树 前 ,必须 确认 还 有 足够 多 的 可 选择 顶点 使 得 算法 
有 可 能 在 右 子 树 中 找到 更 大 的 团 。 

在 具体 实现 时 ,用 邻接 矩阵 表示 图 G。 整 型 数组 v 返回 所 找到 的 最 大 团 。w[ 门 =1 当 且 
仅 当 项 点 i 属于 找到 的 最 大 团 。 


解 最 大 团 问 题 的 回溯 算法 可 描述 如 下 : 


public class MaxClique 


{ 


static int [] x; // 当 前 解 

static int ni // 图 G 的 顶点 数 
static int cn; // 当 前 顶点 数 
static int bestn; // 当 前 最 大 项 点数 
static int [] bestx; // 当 前 最 优 解 


static boolean [J[] a; // 图 G 的 邻接 矩阵 


public static int maxClique(int [] v) 


{ 
// 初 始 化 
x=new int [n+1]; 
cn 一 0; 
bestn=0; 
bestx=v; 
// 回 溯 搜 索 
backtrack(1); 


return bestn; 


private static void backtrack(int i) 
{ 
if (i>n) 
{// 到 达 叶 结 点 
for (int j=1; j<=n; j 十 十 ) 
bestx[j]=x[j]; 
bestn=cn; 
return; 
} 
// 检 查 顶 点 i 与 当前 团 的 连接 
boolean ok= true; 
for (int j=1; j<i; j++) 
if (x0j]== 1 && ! a[iJ0]) 
{//i 与 j 不 相连 
ok= false; 
break; 
} 
if (ok) 
{// 进 入 左 子 树 
x[i]=1; 
cn 十 十 
backtrack(it+ 1); 


cn——; 


回 辉 法 
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if (cnt+n—i>bestn) 
{// 进 入 右 子 树 
x[i]=0; 
backtrack(i 十 1)， 
} 
} 
; 


3. 算法 效率 
最 大 团 问题 的 回溯 算法 backtrack 所 需 的 计算 时 间 显然 为 O(n2”)。 


5.8 图 的 m 着 色 问 题 


1. 问题 描述 

给 定 无 向 连通 图 G 和 wm 种 不 同 的 颜色 。 用 这 些 颜 色 为 图 G 的 各 顶点 着 色 ,每 个 顶点 着 
一 种 颜色 。 是 否 有 一 种 着 色 法 使 G 中 每 条 边 的 两 个 顶点 着 不 同 颜色 。 这 个 问题 是 图 的 疡 
可 着 色 判 定 问题 。 若 一 个 图 最 少 需要 m 种 颜色 才能 使 图 中 每 条 边 连接 的 两 个 顶点 着 不 同 
颜色 , 则 称 这 个 数 m 为 该 图 的 色 数 。 求 一 个 图 的 色 数 m 的 问题 称 为 图 的 m 可 着 色 优化 
问题 。 

如 果 一 个 图 的 所 有 顶点 和 边 都 能 用 某 种 方式 画 在 平面 上 且 没 有 任何 两 条 边 相 交 , 则 称 
这 个 图 是 可 平面 图 。 著 名 的 平面 图 的 4 色 猜 想 是 图 的 m 可 着 色 性 判定 问题 的 特殊 情形 。4 
色 猜 想 : 在 一 个 平面 或 球面 上 的 任何 地 图 能 够 只 用 4 种 颜色 着 色 , 使 相 邻 国家 在 地 图 上 着 
不 同 颜 色 。 这 里 假设 每 个 国家 在 地 图 上 是 单 连通 域 ,还 假设 两 个 国家 相 邻 是 指 这 两 个 国家 
有 一 段 长 度 不 为 0 的 公共 边界 ,而 不 仅 有 一 个 公共 点 。 这 样 的 地 图 很 容易 用 平面 图 表示 。 
地 图 上 每 一 个 区 域 相 应 于 平面 图 中 一 个 顶点 。 两 个 区 域 在 地 图 上 相 邻 ,它们 在 平面 图 中 相 
应 的 两 个 顶点 之 间 有 一 条 边 相 连 。 图 5-6 是 一 个 有 5 个 区 域 的 地 图 及 其 相应 的 平面 图 ,这 
个 地 图 需要 4 种 颜色 着 色 。 


图 5-6 地 图 及 其 相应 的 平面 图 
2. 算法 设计 
本 节 讨 论 一 般 连 通 图 的 可 着 色 性 问题 ,而 不 仅 限 于 平面 图 。 给 定 图 G 二 (V,E) 和 mm 种 
颜色 ,如 果 这 个 图 不 是 m 可 着 色 , 给 出 否定 回答 ;如 果 这 个 图 是 m 可 着 色 的 , 找 出 所 有 不 同 
的 着 色 法 。 
下 面 根据 回溯 法 的 递归 描述 框架 backtrack 设计 图 m 着 色 算法 。 用 图 的 邻接 矩阵 a 表 
示 无 向 连通 图 G 二 (V,E)。 若 (i, 站 属于 图 G 一 (V,E) 的 边 集 下 , 则 a[ 门 [二 1; 否 则 a[ 林 [站 = 


回 淘 法 


0。 整 数 1,2,… ,m 用 来 表示 m 种 不 同 颜 色 。 顶 点 i 所 着 颜色 用 xz[ 让 表示 。 数 组 xz[1:n] 是 
问题 的 解 向 量 。 问 题 的 解 空间 可 表示 为 一 棵 高 度 为 n 十 1 的 完全 m 叉 树 。 解 空间 树 的 第 i 
(1 二 i 三 ) 层 中 每 一 结 点 都 有 m 个 儿子 ,每 个 儿子 相应 于 z[ 右 的 疡 个 可 能 的 着 色 之 一 。 第 
n 十 1 层 结 点 均 为 叶 结 点 。 图 5-7 是 "一 3 入 二 3 时 间 题 的 解 空间 树 。 


志 on 器 


5-7 ?一 3 和 六 一 3 时 的 解 空间 树 


在 下 面 的 解 图 m 可 着 色 问 题 的 回溯 法 中 ,backtrack( 店 搜索 解 空 间 中 第 i 层 子 树 。 类 
Coloring 的 数据 成 员 记 录 解 空间 中 结 点 信息 ,以 减少 传 给 backtrack 的 参数 。sum 记录 当 
前 找到 的 mx 可 着 色 方 案 数 。 

在 算法 backtrack 中 , 当 i>n 时 ,算法 搜索 至 叶 结 点 ,得 到 新 的 m 着 色 方 案 , 当 前 找到 
的 m 可 着 色 方案 数 sum 增 1。 

当 i<n 时 ,当前 扩展 结 点 Z 是 解 空间 中 的 内 部 结 点 。 该 结 点 有 xz[ 门 =1,2,…,m 共 m 
个 儿子 结 点 。 对 当前 扩展 结 点 Z 的 每 一 个 儿子 结 点 ,由 方法 ok 检查 其 可 行 性 ,并 以 深度 优 
先 的 方式 递归 地 对 可 行 子 树 搜索 ,或 前 去 不 可 行 子 树 。 

图 m 可 着 色 问 题 的 回溯 算法 描述 如 下 : 


public class Coloring 
{ 


static int ny // 图 的 顶点 数 
my // 可 用 颜色 数 
static boolean [J[] a; // 图 的 邻接 矩阵 
static int [] x; // 当 前 解 
static long sum; // 当 前 已 找到 的 可 m 着 色 方 案 数 


public static long mColoring(int mm) 
{ 

m=mm; 

sum 一 0; 

backtrack(1); 

return sum; 


} 


private static void backtrack(int t) 
{ 
i (t>n) 
{ 
sum 十 十 ; 
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for (int i=1; i<—n; i 十 十 ) 
System. out. print(x[i] + “"); 
System. out. println(); 
} 
else 
for (int i 一 1;i< 一 mi;i 十 十 ) 
{ 
x[t]=i; 
if (ok(t)) backtrack(t+1); 
x[t]=0; 
} 
} 
private static boolean ok(int k) 
{// 检 查 颜色 可 用 性 
for (int j 王 1;j< 一 njj 十 十 ) 
if Ca[k][j] && (x[j]==x[k])) return false; 
return true; 
} 
} 


3. 算法 效率 
图 mm 可 着 色 问 题 的 回溯 算法 的 计算 时 间 上 界 可 以 通过 计算 解 空间 树 中 内 结 点 个 数 来 
估计 。 图 m 可 着 色 问 题 的 解 空 间 树 中 内 结 点 个 数 是 Tm 。 对 于 每 一 个 内 结 点 ,在 最 坏 情 


况 下 ,用 方法 ok 检查 当前 扩展 结 点 的 每 一 个 儿子 所 相应 的 颜色 可 用 性 需 耗 时 OCxzz) 。 因 
此 ,回溯 法 总 的 时 间 耗 费 是 


nl 
D3 mm) = nm(m CO—1)/(m—1) = Onm") 
i=0 


5.9 旅行 售货员 问题 


1. 算法 描述 

旅行 售货员 问题 的 解 空间 是 一 棵 排列 树 。 对 于 排列 树 的 回溯 搜索 与 生成 1,2,…,n 的 
所 有 排列 的 递归 算法 perm 类 似 。 开 始 时 z= 二 [1,2,… ,nj, 相 应 的 排列 树 由 xz[1:nj 的 所 有 
排列 构成 。 

在 递归 算法 backtrack 中 , 当 i==n 时 ,当前 扩展 结 点 是 排列 树 的 叶 结 点 的 父 结 点 。 此 时 
算法 检测 图 G 是 否 存在 一 条 从 顶点 x[n 一 1] 到 顶点 xz[nj] 的 边 和 一 条 从 顶点 z[nj 到 顶点 1 
的 边 。 如 果 这 两 条 边 都 存在 , 则 找到 一 条 旅行 售货员 回路 。 此 时 ,算法 还 需 判断 这 条 回路 的 
费用 是 否 优 于 当前 已 找到 的 最 优 回路 的 费用 bestc。 如 果 是 , 则 必须 更 新 当前 最 优 值 bestc 
和 当前 最 优 解 bestx。 

当 i<n 时 ,当前 扩展 结 点 位 于 排列 树 的 第 i 一 1 层 。 图 G 中 存在 从 顶点 zx[i 一 1] 到 顶点 
Zz[ 羽 的 边 时 ,zx[1: 丫 构成 图 G 的 一 条 路 径 , 且 当 z[l1: 庙 的 费用 小 于 当前 最 优 值 时 算法 进入 


回 济 法 


排列 树 的 第 i 层 ;否则 ,将 剪 去 相应 的 子 树 。 算 法 中 用 变量 cc 记录 当前 路 径 z[1: 站 的 费用 。 


解 旅行 售货员 问题 的 回溯 算法 可 描述 如 下 : 


public class Bttsp 
{ 


static int n; // 图 G 的 顶点 数 
static int [] x; // 当 前 解 

static int [] bestx; // 当 前 最 优 解 
static float bestc; // 当 前 最 优 值 
static float ce; // 当 前 费用 

static float [J[] a; // 图 G 的 邻接 矩阵 


public static float tsp(int [] v) 
{ 
// 置 x 为 单位 排列 
x=new int [nt+1]; 
for (int i=1; i<=n; i++) 
x[i]=i; 
bestc= Float. MAX_VALUE; 
bestx=v; 
cc=0; 
// 搜 索 x[2:nj 的 全 排列 
backtrack(2); 


return bestc; 


private static void backtrack(int i) 
{ 
if (i==n) 
{ 
if (aLx[n 一 1]][x[n]] 一 Float. MAX_VALUE && 
a[x[m]][1] < Float. MAX_VALUE && 


(bestc== Float. MAX_VALUE ||cct+a[x[Ln—1]][xLnj]+a[xLn]jJ[1]<beste)) 


{ 
for (int j=1; j<=n; j 十 十 ) 
bestx[j]=x[j]; 
bestc=cc+a[x[Ln—1JJ[CxLnj]+aLxLn]J[C1]; 
} 
} 
else 
{ 
for (int j=i; j<=n; j 十 十 ) 
// 是 否 可 进入 x[Lj] 子 树 
让 (a[x[i 一 1]][x[]]<Float MAX_VALUE && 
(bestc 一 一 Float. MAX_VALUE || cc 十 aLx[i 一 1]][Lx[]]<bestc)) 
{// 搜 索 子 树 
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MyMath. swap(x, i, j); 
cet+=aLx[i—1]J[Cx[i]]; 
backtrack(i + 1); 

cc—=aLx[i—1]][x[i]]; 
MyMath. swap(x, i, j); 


} 
. 


2. 算法 效率 

如 果 不 考 虑 更 新 bestx 所 需 的 计算 时 间 , 则 算法 backtrack 需要 O(CCz 一 1)1) 计 算 时 间 。 
由 于 算法 backtrack 在 最 坏 情况 下 可 能 需要 更 新 当前 最 优 和 解 O((n 一 1)1) 次 ,每 次 更 新 bestx 
都 需 O(Cz) 计 算 时 间 , 从 而 整个 算法 的 计算 时 间 复 杂 性 为 O(n1)。 


5.10 圆 排列 问题 


1. 问题 描述 

给 定 个 大 小 不 等 的 圆 c ,cs，… ,cs, 现 要 将 这 个 圆 排 进 一 个 矩形 框 中 , 且 要 求 各 圆 
与 矩形 框 的 底 边 相 切 。 圆 排列 问题 要 求 从 个 圆 的 所 有 排列 
中 找 出 有 最 小 长 度 的 圆 排 列 。 例 如 , 当 n==3, 且 所 给 的 3 个 圆 
的 半径 分 别 为 1,1,2 时 ,这 3 个 圆 的 最 小 长 度 的 圆 排列 如 
图 5-8 所 示 。 其 最 小 长 度 为 2 十 4 V2。 

2. 算法 设计 

圆 排列 问题 的 解 空 间 是 一 棵 排列 树 。 按 照 回 溯 法 搜索 排 ”图 5-8 最 小 长 度 圆 排列 
列 树 的 算法 框架 , 设 开 始 时 a 二 [ ,ro，,…,r,] 是 所 给 的 个 圆 
的 半径 , 则 相应 的 排列 树 由 ae[1 :站 的 所 有 排列 构成 。 

解 圆 排 列 问题 的 回溯 算法 中 ,circlePerm(n,a) 返 回 找到 的 最 小 圆 排 列 长 度 。 初 始 时 ， 
数组 a 是 输入 的 n 个 圆 的 半径 ,计算 结束 后 返回 相应 于 最 优 解 的 圆 排列 。center 用 于 计算 
当前 所 选择 的 圆 在 当前 圆 排 列 中 圆心 的 横 坐 标 。compute 用 于 计算 当前 圆 排列 的 长 度 。 变 
量 min 用 于 记录 当前 最 小 圆 排 列 的 长 度 ; 数 组 x 表示 当前 圆 排 列 ;数组 zx 则 记录 当前 圆 排列 
中 各 圆 的 圆心 横 坐标 。 算 法 中 约定 在 当前 圆 排 列 中 排 在 第 一 个 的 圆 的 圆心 横 坐 标 为 0。 

在 递归 算法 backtrack 中 , 当 这 时 ,算法 搜索 至 叶 结 点 ,得 到 新 的 圆 排列 方案 。 此 时 
算法 调用 compute 计算 当前 圆 排 列 的 长 度 ,适时 更 新 当前 最 优 值 。 

当 i<n 时 ,当前 扩展 结 点 位 于 排列 树 的 第 ;一 1 层 。 此 时 算法 选择 下 一 个 要 排列 的 圆 ， 
并 计算 相应 的 下 界 函 数 。 在 满足 下 界 约束 的 结 点 处 ,以 深度 优先 的 方式 递归 地 对 相应 子 树 
搜索 。 对 于 不 满足 下 界 约束 的 结 点 , 则 剪 去 相应 的 子 树 。 

解 圆 排列 问题 的 回溯 算法 描述 如 下 : 


public class Circles 
{ 


2+4V3 


static int n; // 待 排列 圆 的 个 数 
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static float min; // 当 前 最 优 值 


static float [] x; 


static float [] r; 


public static float circlePerm(int nn, float [] rr) 
{ 

n=nn; 

min=100000; 

x=new float [n 十 1]; 

了 

backtrack(1); 


return min; 


private static void backtrack(int t) 
{ 
if (t>n) compute(); 
else 
for (int j=t; j<=n; j++) 
| 
MyMath. swap(r, t, j); 
float centerx 一 center(t); 
if (centerx+r[t] 二 +r[1]<=min) 
{// 下 界 约 束 
x[t]=centerx; 
backtrack(t+1); 
} 
MyMath. swaplr, t, j); 


private static float center(int t) 
{ // 计 算 当前 所 选择 圆 的 圆心 横 坐 标 
float temp 一 0; 
for (int j 王 1;j 王 tj 十 十 ) 
{ 
float valuex= (float) (x[j]++2.0* Math. sqrt(r[t] * r[j])); 
if (valuex> temp) temp= valuex; 
} 


return temp; 


private static void compute() 
{ // 计 算 当 前 圆 排列 的 长 度 


float low 一 0， 
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high 一 0; 
for (int i 一 1;i< 一 nii 十 十 ) 
长 
if (x[i]—r[i]<low) low=x[i]—r[i]; 
if (x[i]+r[i]>high) high=x[i]+r[i]; 
} 
if (high—low<min) min= high— low; 
人 
} 


3. 算法 效率 

如 果 不 考 虑 计算 当前 圆 排 列 中 各 圆 的 圆心 横 坐 标 和 计算 当前 圆 排列 长 度 所 需 的 计算 时 
间 , 则 算法 backtrack 需要 O(n1) 计 算 时 间 。 由 于 算法 backtrack 在 最 坏 情况 下 可 能 需要 计 
算 O01) 次 当前 圆 排列 长 度 , 每 次 计算 都 需 O(n) 计 算 时 间 , 从 而 整个 算法 的 计算 时 间 复 杂 
性 为 O(n 十 1)1)。 

上 述 算法 尚 有 许多 改进 的 余地 。 例 如 , 像 1,2,…,n 一 1,n 和 n,n 一 1,…,2,1 这 种 互 为 
镜像 的 排列 具有 相同 的 圆 排列 长 度 , 只 计算 一 个 就 够 了 ,可 减少 约 一 半 的 计算 量 。 另 一 方 
面 ,如 果 所 给 的 个 圆 中 有 & 个 圆 有 相同 的 半径 , 则 这 个 圆 产 生 的 &! 个 完全 相同 的 圆 排 
列 , 只 计算 一 个 就 够 了 。 上 述 算法 的 这 些 改进 , 留 作 练习 。 


5.11 电路 板 排列 问题 


1. 问题 描述 
电路 板 排 列 问题 是 大 规模 电子 系统 设计 中 提出 的 实际 问题 。 该 问题 的 提 法 是 ,将 n 块 
电路 板 以 最 佳 排 列 方案 插入 带 有 个 插 模 的 机 箱 中 。n 块 电路 板 的 不 同 的 排列 方式 对 应 于 
不 同 的 电路 板 插入 方案 。 
设 B={1,2,…,n}) 是 nn 块 电路 板 的 集合 。 集 合 L= 二 {Ni,Ns,…,N，} 是 nn 块 电路 板 的 
m 个 连接 块 。 其 中 ,每 个 连接 块 N; 是 B 的 一 个 子 集 , 且 Ni 中 的 电路 板 用 同一 根 导线 连接 
在 一 起 。 
例如 , 设 n=8,m 王 5。 给 定 n 块 电路 板 及 其 mm 个 连接 块 如 下 : 
B={1,2,3,4,5,6,7,8} 
L={Ni;,N;,NssN,,Ns} 
Ni={4,5,6} 
N;,={2,3} 
Ns={1;,3} 
N,={3,6} 
N= {788 
这 8 块 电路 板 的 一 个 可 能 的 排列 如 图 5-9 所 示 。 
设 工 表示 nn 块 电路 板 的 排列 , 即 在 机 箱 的 第 i 个 插 模 中 插入 电路 板 z[ 门 。z 所 确定 的 
电路 板 排列 密度 density(Cz) 定 义 为 跨越 相 邻 电路 板 插 槽 的 最 大 连 线 数 。 
例如 ,图 5-9 中 电路 板 排列 的 密度 为 2。 跨越 插 槽 2 和 3, 插 模 4 和 5 以 及 插 模 5 和 6 的 
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连 线 数 均 为 2。 插 模 6 和 7 之 间 无 跨越 连 线 。 其 余 相 MN 


5 

特权 之 间 都 只 有 1 条 路 起 连 线 。 / 分 个 六 
在 设计 机 箱 时 , 插 档 一 侧 的 布线 间 队 由 电路 板 排 ge 和。 6 ee 
列 的 密度 所 确定 。 因 此 ,电路 板 排列 问题 要 求 对 于 给 


定 电路 板 连接 条 件 (连接 块 ), 确 定 电路 板 的 最 佳 排 
列 , 使 其 具有 最 小 密度 。 

2. 算法 设计 

电路 板 排列 问题 是 NP 难 问题 ,因此 ,不 大 可 能 找到 解 此 问题 的 多 项 式 时 间 算 法 。 下 面 
讨论 用 回溯 法 解 电路 板 排列 问题 。 通 过 系统 地 搜索 电路 板 排列 问题 所 相应 解 空 间 的 排列 
树 , 找 出 电路 板 最 佳 排列 。 

算法 中 用 整 型 数组 5 表示 输入 。5[ 门 [站 的 值 为 1 当 且 仅 当 电路 板 i 在 连接 块 N; 中。 
设 total[ 站 是 连接 块 Ni 中 的 电路 板 数 。 对 于 电路 板 的 部 分 排列 x[1: 门 , 设 now[ 站 是 zx[1: 
让 中 所 包含 的 N; 中 的 电路 板 数 。 由 此 可 知 , 连 接 块 N; 的 连 线 跨 越 插 模 z 和 i 十 1 当 且 仅 当 
now[j] 记 0 且 now[j] 关 total[j]。 可 以 利用 这 个 条 件 来 计算 插 模 i 和 插 权 i 十 1 间 的 连 线 
密度 。 

在 算法 backtrack 中 , 当 i=n 时 ,所 及 n 块 电路 板 都 已 排 定 ,其 密度 为 cd。 由 于 算法 仅 
完成 比 当前 最 优 解 更 好 的 排列 , 故 cd 肯定 优 于 bestd。 此 时 应 更 新 bestd。 

当 i<n 时 ,电路 板 排列 尚未 完成 。xz[1:i 一 1] 是 当前 扩展 结 点 所 相应 的 部 分 排列 ,cd 是 
相应 的 部 分 排列 密度 。 在 当前 部 分 排列 之 后 加 入 一 块 未 排 定 的 电路 板 , 扩 展 当前 部 分 排列 
产生 当前 扩展 结 点 的 一 个 儿子 结 点 。 对 于 这 个 儿子 结 点 ,计算 新 的 部 分 排列 密度 1d。 仅 当 
1d 一 bestd 时 ,算法 搜索 相应 的 子 树 ,否则 该 子 树 被 前 去 。 

按 上 述 回溯 搜索 策略 设计 的 解 电路 板 排 列 问题 的 算法 可 描述 如 下 : 

public class Board 

{ 


5-9 电路 板 排 列 


static int n; // 电 路 板 数 

static int m; // 连 接 块 数 

static int [] x; // 当 前 解 

static int [] bestx; // 当 前 最 优 解 

static int [] total; //total[j] 一 连接 块 j 的 电路 板 数 

static int [] now; //now[j] 王 当前 解 中 所 含 连接 块 j 的 电路 板 数 
static int bestd; // 当 前 最 优 密度 

static int [][] b; // 连 接 块 数组 


public static int arrange(int [J[] bb, int mm, int [] xx) 
{ 

// 初 始 化 

n 一 bb. length 一 1; 

m=mm; 

x=new intLn 十 1]; 

bestx= xx; 


total=new int[m+1]; 
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now 一 new int[m 十 1]; 
bestd 一 m 十 1; 
b=bb; 


// 置 x 为 单位 排列 
// 计 算 total[] 
for (int i=1; i<=n; i++) 
‘ 
x[]=i; 
for (int j=1;j 


total[j]+=b[i]0]; 


// 回 溯 搜 索 
backtrack(1, 0); 


return bestd; 


private static void backtrack(int i, int dd) 
‘ 
if (i==n) 
{ 
for (int j=1; j<=n; j 十 十 ) 
bestx[j]=x[j]; 
bestd= dd; 
} 
else 
for (int j=i} j<=n; j 十 十 ) 
{ // 选 择 x[j] 为 下 一 块 电路 板 
int d=0; 
for (int k=1; k<=m; k 十 十 ) 
now[k] 十 一 b[Lx[D]]Ux]， 
if (now[k]>0 && total[k] ! 王 now[k]) d 十 十 ; 
站 
// 更 新 d 值 
if (dd>d)d=dd; 
if (d=<bestd) 
{ // 搜 索 子 树 
MyMath. swap(x, i, j); 
backtrack(i+1, d); 
MyMath. swap(x, i, ); 
} 
// 恢 复 状 态 
for (int k=1; k<—m; k 十 十 ) 


回 淘 法 
now[k]—=b[Lx[j]JLk]; 


l 
} 


3. 算法 效率 

在 解 空间 排列 树 的 每 个 结 点 处 ,算法 backtrack 花费 OGm) 计 算 时 间 为 每 个 儿子 结 点 计 
算 密度 。 因 此 ,计算 密度 所 耗费 的 总 计算 时 间 为 O(n!1)。 另 外 ,生成 排列 树 需 O(n1) 时 间 。 
每 次 更 新 当前 最 优 解 至 少 使 bestd 减少 1, 而 算法 运行 结束 时 bestd 宇 90。 因此 ,最 优 解 被 更 
新 的 次 数 为 O(m) ,更 新 当前 最 优 解 需 OC(mn) 时 间 。 

综 上 可 知 , 解 电路 板 排列 问题 的 回溯 算法 backtrack 所 需 的 计算 时 间 为 OCmn1)。 


5.12 连续 邮资 问题 


1. 问题 描述 

假设 国家 发 行 了 nn 种 不 同 面值 的 邮票 ,并 且 规 定 每 个 信封 上 最 多 只 允许 贴 m 张 邮 票 。 
连续 邮资 问题 要 求 对 于 给 定 的 n 和 m 的 值 ,给 出 邮票 面值 的 最 佳 设 计 , 在 1 个 信封 上 可 贴 
出 从 邮资 1 开始 , 增 量 为 1 的 最 大 连续 邮资 区 间 。 例 如 , 当 n==5 和 m= 二 4 时 ,面值 为 (1,3， 
11,15,32) 的 5 种 邮票 可 以 贴 出 邮资 的 最 大 连续 邮资 区 间 是 1 一 70。 

2. 算法 设计 

对 于 连续 邮资 问题 ,用 元 组 x[1:n] 表 示 nn 种 不 同 的 邮票 面值 ,并 约定 它们 从 小 到 大 
排列 。z[1]=1 是 唯一 的 选择 。 此 时 的 最 大 连续 邮资 区 间 是 [1:m]。 接 下 来 ,x[2j] 的 可 取 
值 范围 是 [2:m 十 1]。 在 一 般 情况 下 ,已 选 定 z[1:i 一 1], 最 大 连续 邮资 区 间 是 [1:r], 接 下 来 
Zz[ 门 的 可 取 值 范围 是 [x[i 一 1 十 1:r 十 1]。 由 此 可 以 看 出 ,在 用 回溯 法 解 连续 邮资 问题 时 ， 
可 用 树 表示 其 解 空间 。 该 解 空间 树 中 各 结 点 的 度 随 zx 的 不 同 取 值 而 变化 。 

下 面 的 解 连续 邮资 问题 的 回溯 法 中 ,类 Stamps 的 数据 成 员 记 录 解 空间 中 结 点 信息 。 
maxvalue 记录 当前 已 找到 的 最 大 连续 邮资 区 间 ,bestx 是 相应 的 当前 最 优 解 。 数 组 y 用 于 
记录 当前 已 选 定 的 邮票 面值 zxL1 :可 能 贴 出 各 种 邮资 所 需 的 最 少 邮票 数 。 换 名 话说 ,>[A] 是 
用 不 超过 m 张 面值 为 zx[1: 站 的 邮票 贴 出 邮资 & 所 需 的 最 少 邮票 数 。 

在 算法 backtrack 中 , 当 i>n 时 ,算法 搜索 至 叶 结 点 ,得 到 新 的 邮票 面值 设计 方案 x[1: 
nj。 如 果 该 方案 能 贴 出 的 最 大 连续 邮资 区 间 大 于 当前 已 找到 的 最 大 连续 邮资 区 间 
maxvalue, 则 更 新 当前 最 优 值 maxvalue 和 相应 的 最 优 解 bestx。 

当 i<n 时 ,当前 扩展 结 点 Z 是 解 空间 中 的 内 部 结 点 。 在 该 结 点 处 xz[1:i 一 1j 能 贴 出 的 
最 大 连续 邮资 区 间 为 /一 1。 因 此 ,在 结 点 Z 处 ,zx[ 疏 的 可 取 值 范围 是 [zx[i 一 1] 十 1:7j, 从 而 ， 
结 点 Z 有 7 一 x[i 一 1j 个 儿子 结 点 。 算 法 对 当前 扩展 结 点 Z 的 每 一 个 儿子 结 点 ,以 深度 优先 
的 方式 递归 地 对 相应 子 树 进行 搜索 。 

连续 邮资 问题 的 回溯 算法 可 描述 如 下 : 

public class Stamps 

{ 

static int ny // 邮 票面 值 数 
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my // 每 个 信封 允许 贴 的 最 多 邮票 数 
maxR, // 当 前 最 优 值 
maxint, // 大 整数 
maxl; // 邮 资 上 界 
static int [] x; // 当 前 解 
static int [] y; // 贴 出 各 种 邮资 所 需 最 少 邮票 数 
static int [] bestx; // 当 前 最 优 解 


public static int maxStamp(int nn, int mm, int [] xx) 
{ 

int maxll=1500; 

n=nn; 

m=mm; 

maxR=0; 

maxint= Integer. MAX_VALUE; 

maxl= maxll; 

bestx= xx; 

x=new int [n+1]; 

y=new int [maxl 十 1]; 

for (int i=0; i< 一 ni; i++) x[i]=0; 

for (int i=1; i< 一 maxl; i 十 十 ) y[i]= maxint; 

x[1]=1; 

y[L0j=0; 

backtrack(2,1); 


return maxR; 


private static void backtrack(int i,int r) 
{ 
for (int j=0; j<=x[i—2]* (m 一 1);j 二 十 ) 
if (y[j]<m) 
for (int k 一 1;k< 一 mm 一 y[j];k 十 十 ) 
if (y[ 订 十 k<y[Dj 十 x[i 一 1]* k]) yD 十 xLi 一 1] * 区 一 y[j] 十 k; 


while (y[r]=<maxint) r 十 十 ; 


if (i>n) 
{ 
让 (r—1>maxR) 
{ 
maxR=r—1; 
for (int j=1; j< 一 ni j++) 
bestx[j]=x[j]; 
} 


return; 


回 注 法 


) 第 

int [Jz=new int [maxl 十 1]; 5 

for (int k 一 1;k< 一 maxlik 十 十 ) 章 
z[k]=yLk]; 


for (int j=x[i—1]+1;j<=r;j++) 
i (y[r—j]<m) 
{ 
x[i]=j; 
backtrack(it+1,r+1); 
for (int k 王 1;k< 一 maxl;k 十 十 ) 
yLkj=zLk]; 


5.13 回溯 法 的 效率 分 析 


通过 前 面具 体 实例 的 讨论 容易 看 出 ,回溯 算法 的 效率 在 很 大 程度 上 依赖 于 以 下 因素 : 

(1) 产生 z[k] 的 时 间 。 

(2) 满足 显 约束 的 z[kJ 值 的 个 数 。 

(3) 计算 约束 函数 constraint 的 时 间 。 

(4) 计算 上 界 函 数 bound 的 时 间 。 

(5) 满足 约束 函数 和 上 界 函 数 约束 的 所 有 z[kj 的 个 数 。 

好 的 约束 函数 能 显著 地 减少 所 生成 的 结 点 数 ,但 这 样 的 约束 函数 往往 计算 量 较 大 。 因 
此 ,在 选择 约束 函数 时 通常 需要 在 生成 结 点 数 与 约束 函数 计算 量 之 间 折 中 。 

通常 可 用 “ 重 排 原理 ”提高 效率 。 对 于 许多 问题 而 言 , 在 搜索 试探 时 选取 zx[ 疏 的 值 顺 序 
是 任意 的 。 在 其 他 条 件 相当 的 前 提 下 ,让 可 取 值 最 少 的 z[ 疏 优先 将 较 有 效 。 从 图 5-10 关于 
同一 问题 的 两 棵 不 同 解 空 间 树 ,可 以 体会 到 这 种 策略 的 潜力 。 


(b) 
图 5-10 同一 问题 的 两 棵 不 同 的 解 空间 树 
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图 5-10 (a) 中 ,从 第 1 层 剪 去 1 棵 子 树 , 则 从 所 有 应 当 考 虑 的 3 元 组 中 一 次 消去 
12 个 3 元 组 .对 于 图 5-10 (b) ,虽然 同样 从 第 1 层 前 去 1 棵 子 树 , 却 只 从 应 当 考 虑 的 3 元 组 
中 消去 8 个 3 元 组 。 前 者 的 效果 明显 比 后 者 好 。 

解 空 间 的 结构 一 经 选 定 , 影 响 回溯 法 效率 的 前 3 个 因素 就 可 以 确定 ,只 剩 下 生成 结 点 的 
数目 可 变 , 它 将 随 问题 的 具体 内 容 以 及 结 点 的 不 同 生成 方式 而 变动 。 即 使 同一 问题 的 不 同 
实例 ,回溯 法 所 产生 的 结 点 数 也 会 有 很 大 变化 。 对 于 一 个 实例 ,回溯 法 可 能 只 产生 OCz) 个 
结 点 。 而 对 另 一 个 非常 相近 的 实例 ,回溯 法 可 能 会 产生 解 空间 中 所 有 结 点 。 如 果 解 空间 的 
结 点 数 是 2" 或 n1, 在 最 坏 情况 下 ,回溯 法 的 时 间 耗 费 一 般 为 OC(p(m)2") 或 Ol(g(n)n!1)。 其 
中 p(n) 和 g(r) 均 为 n 的 多 项 式 。 对 于 具体 问题 来 说 ,回溯 法 的 有 效 性 往往 体现 在 当 问题 实 
例 的 规模 较 大 时 , 它 能 用 很 少时 间 求 得 问题 的 解 。 而 对 于 问题 的 具体 实例 ,又 很 难 预 测 回 
淹 法 的 算法 行为 。 特 别 是 很 难 估计 出 回溯 法 在 解 具体 实例 时 所 产生 的 结 点 数 。 这 是 在 分 析 
回溯 法 效率 时 遇 到 的 主要 困难 。 下 面 介绍 一 个 概率 方法 ,用 于 克服 这 一 困难 。 

用 回溯 法 解 具体 问题 的 具体 实例 时 ,可 用 概率 方法 估算 回溯 法 将 产生 的 结 点 数 。 该 方 
法 的 主要 思想 是 在 解 空间 树 上 产生 一 条 随机 路 径 , 然 后 沿 此 路 径 估算 解 空间 树 中 满足 约束 
条 件 的 结 点 总 数 m。 设 z+ 是 所 产生 的 随机 路 径 上 的 一 个 结 点 , 且 位 于 解 空间 树 的 第 i 层 。 
对 于 zz 的 所 有 儿子 结 点 ,用 约束 函数 检测 出 满足 约束 条 件 的 结 点 数 m;。 下 一 个 结 点 从 zz 的 
mi 个 满足 约束 的 儿子 结 点 中 随机 选取 。 这 条 路 径 一 直 延 伸 到 叶 结 点 或 者 所 有 儿子 结 点 都 
不 满足 约束 条 件 时 为 止 。 通 过 m; 的 值 , 可 估算 出 解 空间 树 中 满足 约束 条 件 的 结 点 总 数 m。 
用 回溯 法 求 问题 的 所 有 解 时 ,这 个 数 特别 有 用 。 因 为 在 这 种 情况 下 , 解 空间 中 所 有 满足 约束 
条 件 的 结 点 都 必须 生成 。 若 只 要 求 用 回溯 法 找 出 问题 的 一 个 解 , 则 所 生成 的 结 点 数 一 般 只 
是 m 个 满足 约束 条 件 的 结 点 中 的 一 小 部 分 。 此 时 用 mm 来 估计 回溯 法 生成 的 结 点 数 就 过 于 

为 了 从 m; 的 值 求 得 m 的 值 ,还 需要 对 约束 函数 做 一 些 假定 。 在 估计 m 时 ,假定 所 有 约 
东 函 数 是 静态 的 。 也 就 是 说 ,在 回溯 法 执行 过 程 中 ,约束 函数 并 不 随 着 算法 所 获得 信息 的 多 
少 而 动态 地 改变 。 进 一 步 还 假设 解 空间 树 中 同一 层 结 点 所 用 的 约束 函数 相同 。 对 于 大 多 数 
回溯 法 ,这 种 假定 太 强 。 实 际 上 ,大 多 数 回溯 法 中 ,约束 函数 随 着 搜索 过 程 的 深入 而 逐渐 加 
强 。 在 这 种 情形 下 , 按 假定 估计 m 就 显得 保守 。 如 果 考 虑 约束 函数 的 变化 ,所 得 出 的 满足 
约束 条 件 的 结 点 总 数 要 比 估计 的 m 少 ,而 且 也 更 精确 。 

在 静态 约束 函数 假设 下 ,第 1 层 有 mo 个 满足 约 东 条件 的 结 点 。 若 解 空间 树 的 同一 层 
结 点 具有 相同 的 出 度 , 则 第 1 层 上 每 个 结 点 平均 有 wm 个 儿子 结 点 满足 约束 条 件 。 因 此 ,第 
2 层 有 oz 个 满足 约束 条 件 的 结 点 。 同 理 , 第 3 层 上 满足 约 东 条 件 的 结 点 个 数 为 
momims。 依 此 类 推 ,可 知 第 i+1 层 上 满足 约束 条 件 的 结 点 个 数 为 mozaza…z2i。 因 此 ,对 
于 给 定 输入 ,随机 产生 解 空间 树 上 的 一 条 路 径 ,计算 mo ,za ,za ,…:, ij，… 可 以 估计 出 回溯 
法 生成 的 满足 约束 条 件 的 结 点 总 数 mm 为: 1 十 zzo 十 mzomai 十 zzomaizzz 十 …。 

下 面 的 算法 estimate 依据 上 述 思想 来 计算 回溯 法 生成 的 结 点 总 数 mm。 该 算法 从 解 空间 
树 的 根 结 点 开始 选取 一 条 随机 路 径 。 其 中 ,choose 从 集合 了 中 随机 选取 一 个 元 素 。 

public int estimate(int n) 


{ 


int m=1» r=1, k=1» 


回 淘 法 


while (k<=n) { 
T 二 x[kj 的 满足 约束 的 可 取 值 集合 ; 
if (T. size==0) return m; 章 


a 


Tx 一 工 . size; 
m 十 一 r; 
x[k]=T. choose()， 
k 二 十 ;} 
return m; 


下 


用 回溯 法 解 具体 问题 时 ,可 用 算法 estimate 估算 回溯 法 生成 的 结 点 数 。 若 要 估计 得 更 
精确 ,可 选取 若干 条 不 同 的 随机 路 径 ( 通 常 不 超过 20 条 ) ,分 别 对 各 随机 路 径 估计 结 点 总 数 ， 
然后 再 取 这 些 结 点 总 数 的 平均 值 ,得 到 m 的 估算 值 。 

例如 ,对 于 8 后 问题 ,要 在 8X8 的 棋盘 中 放 进 8 个 皇后 ,其 放 法 的 组 合 数 很 大 。 利 用 显 
约束 排除 两 个 皇后 在 同一 行 或 同一 列 的 放 法 ,也 还 有 8! 种 不 同 的 放 法 。 用 算法 estimate 估 
计 回溯 法 nQueen 所 产生 的 结 点 总 数 。 对 于 该 问题 ,约束 函数 的 静态 假设 成 立 ,在 算法 搜索 
过 程 中 ,约束 函数 没有 改变 。 另 外 ,在 解 空间 树 中 ,同一 层 所 有 结 点 有 相同 出 度 。 图 5-11 给 
出 算法 estimate 产生 的 5 条 随机 路 径 所 相应 的 8X8 棋盘 状态 。 当 需要 在 棋盘 上 某 行 放 入 
一 个 皇后 时 ,随机 选取 所 放 的 列 。 


1 [ T1 | ] 1 
2 | 2 | 2 
3 |3 | 3 
4 | | 14 | 4 
5 | 5| | 5 
6| | | 6 
| | 7 
ET 
(8,5,4,3,2)=1649 (6,5,3,1,2,1)=769 (8,6,4.2,1,1,1)=1785 
1 1 
2 2 
3 3 
4 4 
5 5 
6 
学 
8 
(8,6.4.3,2)=1977 (8,5,3,2,2,1,1,1)=2329 


图 5-11 解 空间 树 中 5 条 随机 路 径 所 对 应 棋盘 状态 


图 5-11 中 棋盘 下 面 列 出 了 每 一 层 结 点 可 能 生成 的 满足 约束 条 件 的 结 点 数 , 即 mo ,za ， 
7 ,72 以 及 由 此 随机 路 径 估算 出 的 结 点 总 数 mx。 由 这 5 条 随机 路 径 可 得 m 的 平均 值 为 
1702。8 后 问题 的 解 空间 树 的 结 点 总 数 是 


1 十 >I-0)= 109601 
由 此 可 见 ,回溯 法 产生 的 结 点 数 n 是 解 空间 树 结 点 总 数 的 1.55% 左 右 。 这 说 明 回溯 法 
的 效率 大 大 高 于 穷 举 法 。 
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小 结 


本 章 介绍 的 回溯 法 可 用 于 系统 地 搜索 问题 的 所 有 解 。 回 漳 法 是 一 个 既 带 有 系统 性 又 带 


有 跳跃 性 的 搜索 算法 。 它 在 问题 的 解 空间 树 中 , 按 深度 优先 策略 ,从 根 结 点 出 发 搜索 解 空间 
树 。 本 章 详细 叙述 了 回溯 法 的 算法 框架 ,并 用 许多 典型 的 难 解 问题 ,如 装载 问题 . 批 处 理 作 
业 调 度 ,符号 三 角形 问题 ,” 后 问题 .0-1 背包 问题 ,最 大 团 问 题 、 图 的 m 着 色 问 题 \ 旅 行 售 货 
员 问 题 、 圆 排列 问题 ,电路 板 排列 问题 .连续 邮资 问题 等 ,从 算法 的 不 同 侧面 阐述 回溯 法 的 应 
用 技巧 ,以 期 收 到 举一反三 的 效果 。 最 后 讨论 了 分 析 回 溯 法 效率 的 方法 。 


5-1 


5-2 


5-3 


5-4 
5-5 


习 题 


用 5.2 节 中 的 改进 策略 (1) 重 写 装载 问题 回溯 法 ,使 改进 后 算法 计算 时 间 复 杂 性 为 
Os 

用 5.2 节 中 的 改进 策略 (2) 重 写 装载 问题 回溯 法 ,使 改进 后 算法 计算 时 间 复 杂 性 为 
O(2")。 

重 写 0-1 背包 问题 的 回溯 法 ,使 算法 能 输出 最 优 解 。 

试 设计 一 个 解 最 大 团 问题 的 迭代 回溯 法 。 

设 G 是 有 n 个 项 点 的 有 向 图 ,从 顶点 i 发 出 的 边 的 最 大 费用 记 为 max(i)。 


(1) 证 明 旅行 售货员 回路 的 费用 不 超过 Dmax?) +1。 


(2) 在 旅行 售货员 问题 的 回溯 法 中 ,用 上 上 面 的 界 作为 bestec 的 初始 值 , 重 写 该 算法 ,并 
尽 可 能 地 简化 代码 。 
设 G 是 有 个 顶点 的 有 向 图 ,从 顶点 i 发 出 的 边 的 最 小 费用 记 为 min(i)。 


(1) 证 明 图 G 的 所 有 前 级 为 zx[1 :如 的 旅行 售货员 回路 的 费用 至 少 为 > az sz) 十 
j=2 


Dmins, ) ,其 中 a(u,v) 是 边 (u,v) 的 费用 。 


(2) 利用 上 述 结论 设计 一 个 高 效 的 上 界 函 数 , 重 写 旅 行 售货员 问题 的 回溯 法 ,并 与 教 
材 中 的 算法 进行 比较 。 


第 章 
0 分 支 限 界 法 


分 支 限 界 法 类 似 于 回溯 法 ,是 在 问题 的 解 空间 树 上 搜索 问题 解 的 算法 。 一 般 情 况 下 ,分 
支 限界 法 与 回溯 法 的 求解 目标 不 同 。 回 溯 法 的 求解 目标 是 找 出 解 空间 树 中 满足 约束 条 件 的 
所 有 人 解 ,而 分 支 限 界 法 的 求解 目标 则 是 找 出 满足 约束 条 件 的 一 个 解 , 或 是 在 满足 约束 条 件 的 
解 中 找 出 使 某 一 目标 函数 值 达到 极 大 或 极 小 的 解 , 即 在 某 种 意义 下 的 最 优 解 。 

由 于 求解 目标 不 同 ,导致 分 支 限界 法 与 回溯 法 对 解 空间 树 的 搜索 方式 也 不 相同 。 回 淹 
法 以 深度 优先 的 方式 搜索 解 空间 树 ,而 分 支 限界 法 则 以 广度 优先 或 以 最 小 耗费 优先 的 方式 
搜索 解 空间 树 。 分 支 限界 法 的 搜索 策略 是 ,在 扩展 结 点 处 ,先生 成 其 所 有 的 儿子 结 点 (分 
支 ) ,然后 再 从 当前 的 活 结 点 表 中 选择 下 一 个 扩展 结 点 。 为 了 有 效 地 选择 下 一 扩展 结 点 ,加 
速 搜索 进程 ,在 每 一 活 结 点 处 ,计算 一 个 函数 值 (限界 ) ,并 根据 函数 值 ,从 当前 活 结 点 表 中 选 
择 一 个 最 有 利 的 结 点 作为 扩展 结 点 ,使 搜索 朝 着 解 空间 树 上 有 最 优 解 的 分 支 推进 ,以 便 尽 快 
地 找 出 一 个 最 优 解 。 这 种 方法 称 为 分 支 限界 法 。 人 们 已 经 用 分 支 限界 法 解决 了 大 量 离散 最 
优化 问题 。 


6.1 分 支 限 界 法 的 基本 思想 


分 支 限界 法 常 以 广度 优先 或 以 最 小 耗费 (最 大 效益 ) 优 先 的 方式 搜索 问题 的 解 空间 树 。 问 
题 的 解 空间 树 是 表示 问题 解 空 间 的 一 棵 有 序 树 ,常见 的 有 子 集 树 和 排列 树 。 在 搜索 问题 的 解 
空间 树 时 ,分 支 限 界 法 与 回溯 法 的 主要 不 同 在 于 它们 对 当前 扩展 结 点 所 采用 的 扩展 方式 。 在 
分 支 限 界 法 中 ,每 一 个 活 结 点 只 有 一 次 机 会 成 为 扩展 结 点 。 活 结 点 一 旦 成 为 扩展 结 点 ,就 一 次 
性 产生 其 所 有 儿子 结 点 。 在 这 些 儿 子 结 点 中 ,导致 不 可 行 解 或 导致 非 最 优 解 的 儿子 结 点 被 舍 
弃 , 其 余 儿 子 结 点 被 加 入 活 结 点 表 中 。 此 后 ,从 活 结 点 表 中 取 下 一 结 点 成 为 当前 扩展 结 点 ,并 
重复 上 述 结 点 扩展 过 程 。 这 个 过 程 一 直 持 续 到 找到 所 需 的 解 或 活 结 点 表 为 空 时 为 止 。 

从 活 结 点 表 中 选择 下 一 扩展 结 点 的 不 同方 式 导致 不 同 的 分 支 限 界 法 。 最 常见 的 有 以 下 
两 种 方式 。 

1) 队列 式 (FIFO) 分 支 限 界 法 

队列 式 分 支 限 界 法 将 活 结 点 表 组 织 成 一 个 队列 ,并 按 队列 的 先进 先 出 FIFO (first in 
first out) 原 则 选取 下 一 个 结 点 为 当前 扩展 结 点 。 

2) 优先 队列 式 分 支 限 界 法 

优先 队列 式 的 分 支 限界 法 将 活 结 点 表 组 织 成 一 个 优先 队列 ,并 按 优先 队列 中 规定 的 结 
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点 优先 级 选取 优先 级 最 高 的 下 一 个 结 点 成 为 当前 扩展 结 点 。 

优先 队列 中 规定 的 结 点 优先 级 常用 一 个 与 该 结 点 相关 的 数值 p 表示 。 结 点 优先 级 的 
高 低 与 p 值 的 大 小 相关 。 最 大 优先 队列 规定 p 值 较 大 的 结 点 优先 级 较 高 。 在 算法 实现 时 
通常 用 最 大 堆 来 实现 最 大 优先 队列 ,用 最 大 堆 的 removeMax 运算 抽取 堆 中 下 一 个 结 点 成 为 
当前 扩展 结 点 ,体现 最 大 效益 优先 的 原则 。 类 似 地 ,最 小 优先 队列 规定 p 值 较 小 的 结 点 优 
先 级 较 高 。 在 算法 实现 时 通常 用 最 小 堆 来 实现 最 小 优先 队列 ,用 最 小 堆 的 removeMin 运算 
抽取 堆 中 下 一 个 结 点 成 为 当前 扩展 结 点 ,体现 最 小 费用 优先 的 原则 。 

用 优先 队列 式 分 支 限界 法 解 具 体 问题 时 ,应 根据 具体 问题 的 特点 确定 选用 最 大 优先 队 
列 或 最 小 优先 队列 表示 解 空间 的 活 结 点 表 。 

例如 ,考虑 一 3 时 0-1 背包 问题 的 一 个 实例 如 下 。w= 二 [16,15,15],p 二 [45,25， 
25],c 王 30。 队 列 式 分 支 限界 法 用 一 个 队列 来 存储 活 结 点 表 , 而 优先 队列 式 分 支 限界 法 
则 将 活 结 点 表 组 成 优先 队列 并 用 最 大 堆 来 实现 该 优先 队列 ,该 优先 队列 的 优先 级 定义 为 
活 结 点 所 获得 的 价值 。 这 个 例子 与 在 第 5 章 中 讨论 的 例子 相同 ,其 解 空间 是 图 5-1 中 的 
子 集 树 。 

用 队列 式 分 支 限界 法 解 此 问题 时 ,算法 从 根 结 点 A 开始 。 初 始 时 活 结 点 队列 为 空 , 结 
点 A 是 当前 扩展 结 点 。 结 点 A 的 2 个 儿子 结 点 A 和 B 均 为 可 行 结 点 , 故 将 这 2 个 儿子 结 点 
按 从 左 到 右 的 顺序 加 入 活 结 点 队列 ,并 且 舍 弃 当 前 扩展 结 点 A。 依 先进 先 出 的 原则 ,下 一 个 
扩展 结 点 是 活 结 点 队列 的 队 首 结 点 B。 扩 展 结 点 了 得 到 其 儿子 结 点 D 和 下 。 由 于 D 是 不 
可 行 结 点 , 故 被 售 去 。E 是 可 行 结 点 ,被 加 入 活 结 点 队列 。 接 下 来 ,C 成 为 当前 扩展 结 点 , 它 
的 2 个 儿子 结 点 F 和 G 均 为 可 行 结 点 ,因此 被 加 入 到 活 结 点 队列 中 。 扩 展 下 一 个 结 点 王 得 
到 结 点 J 和 开 。 本 是 不 可 行 结 点 ,因而 被 售 去 。K 是 一 个 可 行 的 叶 结 点 ,表示 所 求 问题 的 一 
个 可 行 解 ,其 价值 为 45。 

当前 活 结 点 队列 的 队 首 结 点 下 成 为 下 一 个 扩展 结 点 。 它 的 2 个 儿子 结 点 L 和 M 均 为 
叶 结 点 。L 表示 获得 价值 为 50 的 可 行 解 ,M 表示 获得 价值 为 25 的 可 行 解 。G 是 最 后 的 一 
个 扩展 结 点 ,其 儿子 结 点 N 和 0 均 为 可 行 叶 结 点 。 最 后 , 活 结 点 队列 已 空 ,算法 终止 。 算 法 
搜索 得 到 最 优 值 为 50。 

从 这 个 例子 容易 看 出 ,队列 式 分 支 限 界 法 搜索 解 空间 树 的 方式 与 解 空 间 树 的 广度 优先 
遍历 算法 极为 相似 。 唯 一 的 不 同 之 处 是 队列 式 分 支 限 界 法 不 搜索 以 不 可 行 结 点 为 根 的 
子 树 。 

优先 队列 式 分 支 限界 法 从 根 结 点 A 开始 搜索 解 空间 树 。 用 一 个 极 大 堆 表 示 活 结 点 表 
的 优先 队列 。 初 始 时 堆 为 空 ,扩展 结 点 A 得 到 它 的 2 个 儿子 结 点 B 和 C。 这 2 个 结 点 均 为 
可 行 结 点 ,因此 被 加 入 到 堆 中 , 结 点 A 被 舍弃 。 结 点 B 获得 的 当前 价值 是 40 ,而 结 点 C 的 
当前 价值 为 0。 由 于 结 点 B 的 价值 大 于 结 点 C 的 价值 ,所 以 结 点 B 是 堆 中 最 大 元 素 ,从 而 成 
为 下 一 个 扩展 结 点 。 扩 展 结 点 B 得 到 结 点 D 和 下 。D 不 是 可 行 结 点 ,因而 被 舍 去 。E 是 可 
行 结 点 被 加 入 到 堆 中 。E 的 价值 为 40 ,成 为 当前 堆 中 最 大 元 素 ,从 而 成 为 下 一 个 扩展 结 点 。 
扩展 结 点 上 得 到 2 个 叶 结 点 J 和。J 是 不 可 行 结 点 被 舍弃 。K 是 一 个 可 行 叶 结 点 ,表示 
所 求 问题 的 一 个 可 行 解 , 其 价值 为 45。 此 时 , 堆 中 仅 剩 下 一 个 活 结 点 C, 它 成 为 当前 扩展 结 
点 。 它 的 2 个 儿子 结 点 F 和 G 均 为 可 行 结 点 ,因此 被 插入 到 当前 堆 中 。 结 点 下 的 价值 为 
25, 是 堆 中 最 大 元 素 ,成 为 下 一 个 扩展 结 点 。 结 点 下 的 2 个 儿子 结 点 L 和 M 均 为 叶 结 点 。 
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叶 结 点 世相 应 于 价值 为 50 的 可 行 解 。 叶 结 点 M 相应 于 价值 为 25 的 可 行 解 。 叶 结 点 工 所 
相应 的 解 成 为 当前 最 优 解 。 最 后 , 结 点 G 成 为 扩展 结 点 ,其 儿子 结 点 N 和 0 均 为 叶 结 点 ， 
它们 的 价值 分 别 为 25 和 0。 接 下 来 ,存储 活 结 点 的 堆 已 空 ,算法 终止 。 算 法 搜索 得 到 最 优 
值 为 50。 相 应 的 最 优 解 是 从 根 结 点 A 到 结 点 丁 的 路 径 (0,1,1)。 

在 寻求 问题 的 最 优 解 时 ,与 讨论 回溯 法 时 类 似 , 可 以 用 剪 枝 函数 加 速 搜索 。 该 函数 给 出 
每 一 个 可 行 结 点 相应 的 子 树 可 能 获得 的 最 大 价值 的 上 界 。 如 果 这 个 上 界 不 比 当前 最 优 值 更 
大 , 则 说 明 相 应 的 子 树 中 不 含 问题 的 最 优 解 ,因而 可 以 前 去 。 另 一 方面 ,也 可 以 将 上 界 函 数 
确定 的 每 个 结 点 的 上 界 值 作为 优先 级 ,以 该 优先 级 的 非 增 序 抽取 当前 扩展 结 点 。 这 种 策略 
有 时 可 以 更 迅速 地 找到 最 优 解 。 

考查 4 城市 旅行 售货员 的 例子 ,如 图 5-3 所 示 。 该 问题 的 解 空间 树 是 一 棵 排列 树 。 解 
此 问题 的 队列 式 分 支 限 界 法 以 排列 树 中 结 点 B 作为 初始 扩展 结 点 。 此 时 , 活 结 点 队列 为 
空 。 由 于 从 图 G 的 顶点 1 到 顶点 2,3 和 4 均 有 边 相 连 , 所 以 结 点 也 的 儿子 结 点 C,D,E 均 为 
可 行 结 点 ,它们 被 加 入 到 活 结 点 队列 中 ,并 舍 去 当前 扩展 结 点 B。 当 前 活 结 点 队列 中 的 队 首 
结 点 C 成 为 下 一 个 扩展 结 点 。 由 于 图 G 的 顶点 2 到 顶点 3 和 4 有 边 相 连 , 故 结 点 C 的 2 个 
儿子 结 点 F 和 G 均 为 可 行 结 点 ,从 而 被 加 入 到 活 结 点 队列 中 。 接 下 来 , 结 点 D 和 结 点 下 相 
继 成 为 扩展 结 点 而 被 扩展 。 此 时 , 活 结 点 队列 中 的 结 点 依次 为 E.G,H,I,J,K。 

结 点 下 成 为 下 一 个 扩展 结 点 ,其 儿子 结 点 工 是 一 个 叶 结 点 。 找 到 了 一 条 旅行 售货员 回 
路 ,其 费用 为 59。 从 下 一 个 扩展 结 点 G 得 到 叶 结 点 M, 它 相应 的 旅行 售货员 回路 的 费用 为 
66。 结 点 H 依次 成 为 扩展 结 点 ,得 到 结 点 N 相应 的 旅行 售货员 回路 ,其 费用 为 25 。 这 是 当 
前 最 好 的 一 条 回路 。 下 一 个 扩展 结 点 是 结 点 1, 由 于 从 根 结 点 到 叶 结 点 1 的 费用 26 已 超过 
了 当前 最 优 值 , 故 没有 必要 扩展 结 点 1。 以 结 点 1 为 根 的 子 树 被 前 去 。 最 后 , 结 点 ] 和 K 被 
依次 扩展 , 活 结 点 队列 成 为 空 ,算法 终止 。 算 法 搜索 得 到 最 优 值 为 25, 相 应 的 最 优 解 是 从 根 
结 点 到 结 点 N 的 路 径 (1,3,2,4,1)。 

解 同 一 问题 的 优先 队列 式 分 支 限界 法 用 一 极 小 堆 来 存储 活 结 点 表 。 其 优先 级 是 结 点 的 
当前 费用 。 算 法 还 是 从 排列 树 的 结 点 B 和 空 优先 队列 开始 。 结 点 B 被 扩展 后 , 它 的 3 个 儿 
子 结 点 C,D 和 下 被 依次 插入 堆 中 。 此 时 ,由 于 EE 是 堆 中 具有 最 小 当前 费用 (4) 的 结 点 ,所 以 
处 于 堆 顶 的 位 置 , 它 自然 成 为 下 一 个 扩展 结 点 。 结 点 玉 被 扩展 后 ,其 儿子 结 点 ] 和 K 被 插 
入 当前 堆 中 ,它们 的 费用 分 别 为 14 和 24。 此 时 , 堆 顶 元 素 是 结 点 D, 它 成 为 下 一 个 扩展 结 
点 。 它 的 2 个 儿子 结 点 H 和 工 被 插入 堆 中 。 此 时 堆 中 含有 结 点 C,H,I,J,K。 在 这 些 结 点 
中 , 结 点 H 具有 最 小 费用 ,从 而 它 成 为 下 一 个 扩展 结 点 。 扩 展 结 点 H 后 得 到 一 条 旅行 售 货 
员 回 路 (1,3,2,4,1), 相 应 的 费用 为 25。 接 下 来 , 结 点 丁 成 为 扩展 结 点 ,由 此 得 到 另 一 条 费 
用 为 25 的 回路 (1,4,2,3,1)。 此 后 的 2 个 扩展 结 点 是 结 点 多 和 1。 由 结 点 K 得 到 的 可 行 解 
费用 高 于 当前 最 优 解 。 结 点 I 本身 的 费用 已 高 于 当前 最 优 解 。 从 而 它们 都 不 能 得 到 更 好 的 
解 。 最 后 ,优先 队列 为 空 ,算法 终止 。 

与 0-1 背包 问题 的 例子 类 似 ,可 以 用 一 个 限界 函数 在 搜索 过 程 中 裁剪 子 树 ,以 减少 产生 
的 活 结 点 。 此 时 剪 枝 函 数 是 当前 结 点 扩展 后 可 得 到 的 最 小 费用 的 一 个 下 界 。 如 果 在 当前 扩 
展 结 点 处 ,这 个 下 界 不 比 当 前 最 优 值 更 小 , 则 可 剪 去 以 该 结 点 为 根 的 子 树 。 另 一 方面 ,也 可 
以 每 个 结 点 的 下 界 作为 优先 级 , 依 非 减 序 从 活 结 点 优先 队列 中 抽取 下 一 个 扩展 结 点 。 
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6.2 单 源 最 短路 径 问 题 


单 源 最 短路 径 问 题 适 合 于 用 分 支 限 界 法 求解 。 先 用 单 源 最 短路 径 问 题 的 一 个 具体 实例 
来 说 明 算法 的 基本 思想 。 在 图 6-1 所 给 的 有 向 图 G 中 ,每 一 边 都 有 一 个 非 负 边 权 。 要 求 图 
G 的 从 源 顶 点 s 到 目标 顶点 t 之 间 的 最 短路 径 。 解 单 源 最 短路 径 问题 的 优先 队列 式 分 支 限 
界 法 用 一 极 小 堆 来 存储 活 结 点 表 , 其 优先 级 是 结 点 所 对 应 的 当前 路 长 。 算 法 从 图 G 的 源 顶 
点 s 和 空 优先 队列 开始 。 结 点 s 被 扩展 后 , 它 的 3 个 儿子 结 点 被 依次 插入 堆 中 。 此 后 ,算法 
从 堆 中 取出 具有 最 小 当前 路 长 的 结 点 作为 当前 扩展 结 点 ,并 依次 检查 与 当前 扩展 结 点 相 邻 
的 所 有 项 点。 如果 从 当前 扩展 结 点 i 到 顶点 j 有 边 可 达 , 且 从 源 出 发 ,途经 顶点 i 再 到 顶点 j 
的 所 相应 的 路 径 的 长 度 小 于 当前 最 优 路 径 长 度 , 则 将 该 顶点 作为 活 结 点 插入 到 活 结 点 优先 
队列 中 。 这 个 结 点 的 扩展 过 程 一 直 继续 到 活 结 点 优先 队列 为 空 时 为 止 。 

d i 


图 6-1 有 向 图 G 


图 6-2 是 用 优先 队列 式 分 支 限界 法 解 图 6-1 的 有 向 图 G 的 单 源 最 短路 径 问 题 产生 的 解 
空间 树 。 其 中 ,每 一 个 结 点 旁边 的 数字 表示 该 结 点 所 对 应 的 当前 路 长 。 由 于 图 G 中 各 边 的 
权 均 非 负 ,所 以 结 点 所 对 应 的 当前 路 长 也 是 解 空间 树 中 以 该 结 点 为 根 的 子 树 中 所 有 结 点 所 
对 应 的 路 长 的 一 个 下 界 。 在 算法 扩展 结 点 的 过 程 中 ,一 旦 发 现 一 个 结 点 的 下 界 不 小 于 当前 
找到 的 最 短路 长 , 则 算法 剪 去 以 该 结 点 为 根 的 子 树 。 
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图 6-2 有 向 图 G 的 单 源 最 短路 径 问 题 的 解 空间 树 


在 算法 中 ,还 利用 结 点 间 的 控制 关系 进行 剪 枝 。 例 如 在 图 6-2 中 ,从 源 项 点 s 出 发 ,经 
过 边 a,e,q( 路 长 为 5) 和 经 过 边 c,h( 路 长 为 6) 的 2 条 路 径 到 达 图 G 的 同一 项 点。 在 该 问题 
的 解 空间 树 中 ,这 2 条 路 径 相应 于 解 空间 树 的 2 个 不 同 的 结 点 A 和 B。 由 于 结 点 A 所 相应 
的 路 长 小 于 结 点 B 所 相应 的 路 长 ,因此 以 结 点 A 为 根 的 子 树 中 所 包含 的 从 s 到 t 的 路 长 小 
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于 以 结 点 B 为 根 的 子 树 中 所 包含 的 从 s 到 的 路 长 。 因 而 可 以 将 以 结 点 B 为 根 的 子 树 剪 wa 
去 。 在 这 种 情况 下 , 称 结 点 A 控制 了 结 点 B。 显 然 算法 可 将 被 控制 结 点 所 相应 的 子 树 二 


剪 去 。 


下 面 给 出 的 算法 是 找 出 从 源 项 点 s 到 图 G 中 所 有 其 他 顶点 之 间 的 最 短路 径 ,因此 主要 


利用 结 点 控制 关系 进行 前 枝 。 在 一 般 情况 下 ,如 果 解 空间 树 中 以 结 点 y 为 根 的 子 树 中 所 含 
的 解 优 于 以 结 点 x 为 根 的 子 树 中 所 含 的 解 , 则 结 点 y 控制 了 结 点 x, 以 被 控制 的 结 点 x 为 根 
的 子 树 可 以 前 去。 


在 具体 实现 时 ,算法 用 邻接 矩阵 表示 所 给 的 图 G。 在 类 BBShortest 中 用 一 个 二 维 数组 


a 存储 图 G 的 邻接 矩阵 。 另 外 ,算法 中 用 数组 dist 记录 从 源 到 各 顶点 的 距离 ;用 数组 p 记录 
从 源 到 各 顶点 的 路 径 上 的 前 驱 顶 点 。 


由 于 要 找 的 是 从 源 到 各 顶点 的 最 短路 径 , 所 以 选用 最 小 堆 表 示 活 结 点 优先 队列 。 最 小 


堆 中 元 素 的 类 型 为 HeapNode。 该 类 型 结 点 包含 域 i 用 于 记录 该 活 结 点 所 表示 的 图 G 中 相 
应 顶点 的 编号 ,length 表示 从 源 到 该 顶点 的 距离 。 


public class BBShortest 
{ 
static class HeapNode implements Comparable 
{ 
int i; // 顶 点 编号 
float length; // 当 前 路 长 


HeapNode(int ii, float ll) 
{ 

i=ii; 

length=1l; 
} 


public int compareTo(Object x) 

4 
float xl 一 ((HeapNode)x). length; 
if (length 一 xl) return 一 1; 
if (length 一 一 xl) return 0; 
return 1; 

} 

} 


static float [J[] a; // 图 G 的 邻接 矩阵 


public static void shortest(int v, float [] dist, int [] p) 
《 

int n 一 p. length 一 1; 

MinHeap heap=new MinHeap(); 

// 定 义 源 为 初始 扩展 结 点 

HeapNode enode=new HeapNode(v,0); 
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for (int j=1;j<=n;j+ 二 +) 
dist[j]=Float. MAX_VALUE; 
dist[v]=0; 


while (true) 
{ // 搜 索 问题 的 解 空间 
for (int j 王 1;j< 一 njj 十 十 ) 
if (aLenode. i][j]<Float. MAX _VALUE && enode. length++a[enode. i][j]<dist[j]) 
{  // 顶 点 i 到 顶点 j 可 达 , 且 满足 控制 约束 
dist[j]= enode. length++a[enode. i][j]; 
p[j]= enode. i; 
HeapNode node=new HeapNode(j ,dist[j]); 
heap. put(node); // 加 入 活 结 点 优先 队列 
了 
// 取 下 一 扩展 结 点 
if (heap.isEmpty()) break; 
else enode= (HeapNode) heap. removeMin(); 
} 
} 
上 


算法 开始 时 创建 一 个 最 小 堆 , 用 于 表示 活 结 点 优先 队列 。 堆 中 每 个 结 点 的 length 值 是 
优先 队列 的 优先 级 。 接 着 算法 将 源 顶 点 v 初始 化 为 当前 扩展 结 点 。 

算法 的 while 循环 体 完成 对 解 空间 内 部 结 点 的 扩展 。 对 于 当前 扩展 结 点 ,算法 依次 检 
查 与 当前 扩展 结 点 相 邻 的 所 有 顶点 。 如 果 从 当前 扩展 结 点 i 到 顶点 ] 有 边 可 达 , 且 从 源 出 
发 ,途经 顶点 i 再 到 顶点 j 的 所 相应 的 路 径 的 长 度 小 于 当前 最 优 路 径 长 度 , 则 将 该 项 点 作为 
活 结 点 插入 到 活 结 点 优先 队列 中 。 完 成 对 当前 结 点 的 扩展 后 ,算法 从 活 结 点 优先 队列 中 取 
出 下 一 个 活 结 点 作为 当前 扩展 结 点 ,重复 上 述 结 点 的 分 支 扩 展 。 这 个 结 点 的 扩展 过 程 一 直 
继续 到 活 结 点 优先 队列 为 空 时 为 止 。 算法 结束 后 ,数组 dist 返回 从 源 到 各 顶点 的 最 短 距 
离 。 相 应 的 最 短路 径 容易 从 前 驱 顶 点 数组 p 记录 的 信息 构造 出 。 


6.3 装载 问题 


装载 问题 已 在 第 5 章 中 详细 描述 ,其 实质 是 要 求 第 1 条 船 的 最 优 装载 。 装 载 问题 是 一 
个 子 集 选取 问题 ,因此 其 解 空间 树 是 一 棵 子 集 树 。 

1. 队列 式 分 支 限界 法 

下 面 所 描述 的 算法 是 解 装载 问题 的 队列 式 分 支 限界 法 。 该 算法 只 求 出 所 要 求 的 最 优 
值 。 稍 后 将 讨论 进一步 求 出 最 优 解 。 算 法 maxLoading 具体 实施 对 解 空 间 的 分 支 限界 搜 
索 。 其 中 队列 queue 用 于 存放 活 结 点 表 。 队 列 queue 中 元 素 的 值 表示 活 结 点 所 相应 的 当前 
载重 量 。 当 元 素 的 值 为 一 1 时 ,表示 队列 已 到 达 解 空间 树 同 一 层 结 点 的 尾部 。 

算法 enQueue 用 于 将 活 结 点 加 入 到 活 结 点 队列 中 。 首 先 检查 i 是 否 等 于 nn, 如 果 i 二 nn， 
则 表示 当前 活 结 点 为 一 个 叶 结 点 。 由 于 叶 结 点 不 会 被 进一步 扩展 ,因此 不 必 加 入 到 活 结 点 
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队列 中 。 此 时 只 要 检查 该 叶 结 点 表示 的 可 行 解 是 否 优 于 当前 最 优 解 ,并 适时 更 新 当前 最 优 
解 。 当 i<n 时 ,当前 活 结 点 是 内 部 结 点 ,应 加 入 到 活 结 点 队列 中 。 

算法 maxLoading 在 开始 时 将 i 初始 化 为 1,bestw 初始 化 为 0, 此 时 活 结 点 队列 为 空 。 
将 同 层 结 点 尾部 标志 一 1 加 入 到 活 结 点 队列 中 ,表示 此 时 位 于 第 1 层 结 点 的 尾部 。ew 存储 
当前 扩展 结 点 所 相应 的 重量 。 在 该 算法 的 while 循环 中 ,首先 检测 当前 扩展 结 点 的 左 儿子 
结 点 是 否 为 可 行 结 点 。 如 果 是 , 则 调用 该 enQueue 将 其 加 入 到 活 结 点 队列 中 。 然 后 将 其 右 
儿子 结 点 加 入 到 活 结 点 队列 中 ( 右 儿子 结 点 一 定 是 可 行 结 点 )。 两 个 儿子 结 点 都 产生 后 , 当 
前 扩展 结 点 被 舍 奔 。 活 结 点 队列 中 的 队 首 元 素 被 取出 作为 当前 扩展 结 点 。 由 于 队列 中 每 一 
层 结 点 之 后 都 有 一 个 尾部 标记 一 1, 故 在 取 队 首 元 素 时 , 活 结 点 队列 一 定 不 空 。 当 取出 的 元 
素 是 一 1 时 ,再 判断 当前 队列 是 否 为 空 。 如 果 队 列 非 空 , 则 将 尾部 标记 一 1 加 入 活 结 点 队列 ， 


算法 开始 处 理 下 一 层 的 活 结 点 。 


public class FIFOBBLoading 
《 

static int n; 

static int bestw; 


static ArrayQueue queue; 


public static int maxLoading(int [] w, int c) 
{// 队 列 式 分 支 限界 法 ,返回 最 优 载重 量 

// 初 始 化 

n=w. length—1; 

bestw=0; 

queue 一 new ArrayQueue(); 


queue. put(new Integer( 一 1)); 


int i 一 1; 


int ew 一 0; 


// 搜 索 子 集 空间 树 
while (true) 
{ 
// 检 查 左 儿子 结 点 
if (ew+w[i]<=0) //x[i]=1 
enQueue(ew+w[i], D); 


// 右 儿子 结 点 总 是 可 行 的 


enQueue(ew, D); 


ew = ((Integer) queue. remove()). intValue(); 


让 (ew 一 一 一 1) 
{// 同 层 结 点 尾部 1 
if (queue. isEmpty() ) return bestw; 


queue. put(new Integer(—1)); 


ew 一 ((Jnteger) queue. remove()). intValue(); 


// 当 前 最 优 载 重量 
// 活 结 点 队列 


// 同 层 结 点 尾部 标志 


// 当 前 扩展 结 点 所 处 的 层 
// 扩 展 结 点 所 相应 的 载重 量 


//x[i]=0 
// 取 下 一 扩展 结 点 


// 同 层 结 点 尾部 标志 
// 取 下 一 扩展 结 点 
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诗 直 天 人 进入 下 一 层 
} 
} 


private static void enQueue(int wt, int i) 
{ // 将 活 结 点 加 入 到 活 结 点 队列 Q 中 
if (i==n) 
{// 可 行 叶 结 点 
if (wt>bestw) bestw= wt; 
} 
else // 非 叶 结 点 
queue. put(new Integer(wt)); 


} 


} 
算法 maxLoading 的 计算 时 间 和 空间 复杂 性 均 为 0(2") 。 
2. 算法 的 改进 


与 解 装载 问题 的 回溯 法 类 似 ,可 对 上 述 算法 做 进一步 的 改进 。 设 bestw 是 当前 最 优 解 ; 
ew 是 当前 扩展 结 点 所 相应 的 重量 ;x 是 剩余 集装箱 的 重量 。 则 当 ew 十 rbestw 时 ,可 将 其 
右 子 树 剪 去 。 

算法 maxLoading 初始 时 将 bestw 置 为 0, 直到 搜索 到 第 一 个 叶 结 点 时 才 更 新 bestw。 
因此 在 算法 搜索 到 第 一 个 叶 结 点 之 前 ,总 有 bestw 王 0,r 二 0, 故 ew 十 ”二 bestw 总 是 成 立 。 
也 就 是 说 ,此 时 右 子 树 测试 不 起 作用 。 

为 了 使 上 述 右 子 树 测试 尽早 生效 ,应 提早 更 新 bestw。 知 道 算法 最 终 找 到 的 最 优 值 是 
所 求 问 题 的 子 集 树 中 所 有 可 行 结 点 相应 的 重量 的 最 大 值 。 而 结 点 所 相应 的 重量 仅 在 搜索 进 
入 左 子 树 时 增加 。 因 此 ,可 以 在 算法 每 一 次 进入 左 子 树 时 更 新 bestw 的 值 。 由 此 可 对 算法 
做 进一步 改进 如 下 : 

public class FIFOBBLoading 

| 


static int nj; 


static int bestw; // 当 前 最 优 载重 量 
static ArrayQueue queue; // 活 结 点 队列 


public static int maxLoading(int [] w, int c) 
{// 队 列 式 分 支 限界 法 ,返回 最 优 载重 量 
// 初 始 化 
n 一 w. length 一 1; 
bestw 一 0; 
queue 一 new ArrayQueue(); 
queue. put(new Integer(—1)); // 同 层 结 点 尾部 标志 


int i=1; // 当 前 扩展 结 点 所 处 的 层 
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int ew=0; // 扩 展 结 点 所 相应 的 载重 量 
int r=0; // 剩 余 集装箱 重量 
for (int j=2; j<=n; j 十 十 ) 
r 十 一 wD]; 
// 搜 索 子 集 空间 树 


while (true) 
// 检 查 左 儿子 结 点 
int wt=ew++ w[i]; // 左 儿子 结 点 的 重量 
让 (wt<=¢) 
{// 可 行 结 点 
if (wt>bestw) bestw= wt; 
// 加 入 活 结 点 队列 
if (i<n) queue. put(new Integer(wt)); 


} 


// 检 查 右 儿子 结 点 
if (ewt+r>bestw && i<n) // 可 能 含 最 优 解 
queue. put(new Integer(ew)); 


ew=((Integer) queue. remove()). intValue(); // 取 下 一 扩展 结 点 


if (ew 一 一 一 1) 

{// 同 层 结 点 尾部 
if (queue. isEmpty() ) return bestw; 
queue. put(new Integer( 一 1)); // 同 层 结 点 尾部 标志 
ew 一 ((JInteger) queue. remove()). intValue(); ”// 取 下 一 扩展 结 点 
it+; // 进 入 下 一 层 
r—=w[i]; // 剩 余 集装箱 重量 

} 

} 
} 

} 

当 算法 要 将 一 个 活 结 点 加 入 活 结 点 队列 时 , wt 的 值 不 会 超过 bestw, 故 不 必 更 新 
bestw。 因 此 ,算法 中 可 直接 将 该 活 结 点 插入 到 活 结 点 队列 中 ,不 必 动 用 算法 enQueue 来 完 
成 插入 。 

3. 构造 最 优 解 


为 了 在 算法 结束 后 能 方便 地 构造 出 与 最 优 值 相 应 的 最 优 解 ,算法 必须 存储 相应 子 集 树 
中 从 活 结 点 到 根 结 点 的 路 径 。 为 此 目的 ,可 在 每 个 结 点 处 设置 指向 其 父 结 点 的 指针 ,并 设置 
左 、 右 儿子 标志 。 与 此 相应 的 数据 类 型 由 QNode 表示 。 
private static class QNode 
{ 
QNode parent; // 父 结 点 
boolean leftChild; // 左 儿子 标志 
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int weight; // 结 点 所 相应 的 载重 量 

// 构 造 方法 

private QNode( QNode theParent, boolean theLeftChild, int theWeight) 
长 


parent= theParent; 
leftChild= theLeftChild; 
weight= theWeight; 
} 
} 


将 活 结 点 加 入 到 活 结 点 队列 中 的 算法 enQueue 进行 相应 的 修改 如 下 : 


Private static void enQueue(int wt, int i, QNode parent，boolean leftchild) 
{ 
if (i==n) 
{ // 可 行 叶 结 点 
if (wt== bestw) 
{ // 当 前 最 优 载重 量 
bestE= parent; 
bestx[n]= (leftchild) ? 1 : 0; 
} 
return; 
} 
// 非 叶 结 点 
QNode b=new QNode(parent, leftchild, wt); 


queue. put(b); 
和 
修改 后 算法 可 以 在 搜索 子 集 树 的 过 程 中 保存 当前 已 构造 出 的 子 集 树 中 的 路 径 , 从 而 可 
在 算法 结束 搜索 后 ,从 子 集 树 中 与 最 优 值 相 应 的 结 点 处 向 根 结 点 回溯 ,构造 出 相应 的 最 优 
解 。 根 据 上 述 思想 设计 的 新 的 队列 式 分 支 限界 法 可 表述 如 下 。 算 法 结束 后 ,bestx 中 存放 
算法 找到 的 最 优 解 。 


static int n; 


static int bestw; // 当 前 最 优 载重 量 
static ArrayQueue queue; // 活 结 点 队列 

static QNode bestE; // 当 前 最 优 扩展 结 点 
static int [] bestx; // 当 前 最 优 解 


public static int maxLoading(int [] w, int c, int [] xx) 
{ 

// 初 始 化 

n 一 w. length 一 1; 

bestw 一 0; 


queue 一 new ArrayQueue(); 


queue. put(null) ; // 同 层 结 点 尾部 标志 


QNode e=null; 

bestE=null; 

bestx= xx; 

int i=1; // 当 前 扩展 结 点 所 处 的 层 
int ew=0; // 扩 展 结 点 所 相应 的 载重 量 
int r=0; // 剩 余 集 装 箱 重量 


for (int j=2; j<—=n; j 十 十 )r 十 一 w[j]; 


// 搜 索 子 集 空 间 树 
while (true) 
{ 
// 检 查 左 儿 子 结 点 
int wt=ew++ w[i]; 
让 (wt<=¢) 
{// 可 行 结 点 
if (wt>bestw) bestw= wt; 


enQueue(wt, i, e, true); 


// 检 查 右 儿子 结 点 

if (ew+r>bestw) enQueue(ew, i, e, false); 

e= (QNode) queue. remove(); // 取 下 一 扩展 结 点 
if (e==null) // 同 层 结 点 尾部 


{ 
if (queue. isEmpty()) break; 


queue. put(null); // 同 层 结 点 尾部 标志 
e 一 (QNode) queue. remove(); // 取 下 一 扩展 结 点 
计 十 ; // 进 入 下 一 层 
IT 一 一 w[i] // 剩 余 集 装 箱 重量 
} 
ew=e. weight; // 新 扩展 结 点 所 相应 的 载重 量 
} 
// 构 造 当前 最 优 解 


for (int j=n—1; j>0; j——) 

# 
bestx[j]= (bestE. leftChild) ? 1 : 0; 
bestE= bestE. parent; 

} 

return bestw; 


} 
4. 优先 队列 式 分 支 限界 法 
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解 装载 问题 的 优先 队列 式 分 支 限界 法 用 最 大 优先 队列 存储 活 结 点 表 。 活 结 点 x 在 优先 
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队列 中 的 优先 级 定义 为 从 根 结 点 到 结 点 x 的 路 径 所 相应 的 载重 量 再 加 上 剩余 集装箱 的 重量 
之 和 ,优先 队列 中 优先 级 最 大 的 活 结 点 成 为 下 一 个 扩展 结 点 ,优先 队列 中 活 结 点 x 的 优先 级 
为 x. uweight。 以 结 点 x 为 根 的 子 树 中 所 有 结 点 相应 的 路 径 的 载重 量 不 超过 x. uweight。 
子 集 树 中 叶 结 点 所 相应 的 载重 量 与 其 优先 级 相同 。 因 此 在 优先 队列 式 分 支 限 界 法 中 ,一旦 
有 一 个 叶 结 点 成 为 当前 扩展 结 点 , 则 可 以 断言 该 叶 结 点 所 相应 的 解 即 为 最 优 解 。 此 时 可 终 
止 算法 。 

上 述 策略 可 以 用 两 种 不 同 的 方式 来 实现 。 第 一 种 方式 在 结 点 优先 队列 的 每 一 个 活 结 
点 中 保存 从 解 空 间 树 的 根 结 点 到 该 活 结 点 的 路 径 。 算 法 确定 了 达到 最 优 值 的 叶 结 点 时 ， 
在 该 叶 结 点 处 同时 得 到 相应 的 最 优 解 。 第 二 种 策略 在 算法 的 搜索 进程 中 保存 当前 已 构 
造 出 的 部 分 解 空间 树 。 这 样 在 算法 确定 了 达到 最 优 值 的 叶 结 点 时 ,就 可 以 在 解 空间 树 中 
从 该 叶 结 点 开始 向 根 结 点 回溯 ,构造 出 相应 的 最 优 解 。 下 面 所 描述 的 算法 ,采用 第 二 种 
策略 。 

算法 中 用 元 素 类 型 为 HeapNode 的 最 大 堆 来 表示 活 结 点 优先 队列 。 其 中 ,uweight 是 
活 结 点 优先 级 (上 界 ) ;level 是 活 结 点 在 子 集 树 中 所 处 的 层 序号 。 子 集 空间 树 中 结 点 类 型 为 
BBnode。 


static class BBnode 
{ 


BBnode parent; // 父 结 点 
boolean leftChild; // 左 儿子 结 点 标志 
// 构 造 方法 


BBnode( BBnode par, boolean ch) 
{ 

parent= par; 

leftChild= ch; 
} 


static class HeapNode implements Comparable 
{ 
BBnode liveNode; 


int uweight; // 活 结 点 优先 级 (上 界 ) 
int level; // 活 结 点 在 子 集 树 中 所 处 的 层 序号 
// 构 造 方法 


HeapNode( BBnode node, int up, int lev) 
{ 

liveNode= node; 

uweight= up; 

level= lev; 


} 


; 
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public int compareTo(Object x) 第 
{ 6 
int xuw 一 ((HeapNode) x). uweight; 章 


if (uweight<xuw) return 一 1; 
if (uweight== xuw) return 0; 
return 1; 


} 


public boolean equals(Object x) 
{return uweight== ((HeapNode) x). uweight;} 


在 解 装载 问题 的 优先 队列 式 分 支 限 界 法 中 ,算法 addLiveNode 将 新 产生 的 活 结 点 加 入 
到 子 集 树 中 ,并 将 这 个 新 结 点 插入 到 表示 活 结 点 优先 队列 的 最 大 堆 中 。 


Private static void addLiveNode(int up, int lev, BBnode par, boolean ch) 


| 


} 


// 将 活 结 点 加 入 到 表示 活 结 点 优先 队列 的 最 大 堆 H 中 
BBnode b=new BBnode(par, ch); 

HeapNode node=new HeapNode(b, up, lev); 

heap. put(node); 


算法 maxLoading 具体 实施 对 解 空间 的 优先 队列 式 分 支 限界 搜索 。 第 ;十 1 层 结 点 的 剩 


n 


余 重量 x[ 门 定义 为 r[ 门 二 >) w[j] 。 变量。 是 子 集 树 中 当前 扩展 结 点 ,ew 是 相应 的 重量 。 


了 一 计 1 


算法 开始 时 ,i 二 1,ew 二 0, 子 集 树 的 根 结 点 是 扩展 结 点 。 

算法 的 while 循环 体 产生 当前 扩展 结 点 的 左右 儿子 结 点 。 如 果 当 前 扩展 结 点 的 左 儿 子 
结 点 是 可 行 结 点 , 即 它 所 相应 的 重量 未 超过 船 载 容量 , 则 将 它 加 入 到 子 集 树 的 第 ;二 1 层 上 ， 
并 搬入 最 大 堆 。 扩 展 结 点 的 右 儿 子 结 点 总 是 可 行 的 , 故 直 接 插 入 子 集 树 的 最 大 堆 中 。 接 着 
算法 从 最 大 堆 中 取出 最 大 元 作为 下 一 个 扩展 结 点 。 如 果 此 时 不 存在 下 一 个 扩展 结 点 , 则 相 
应 的 问题 无 可 行 解 。 如 果 下 一 个 扩展 结 点 是 一 个 叶 结 点 , 即 子 集 树 中 第 十 1 层 结 点 , 则 它 
相应 的 可 行 解 为 最 优 解 。 该 最 优 解 所 相应 的 路 径 可 由 子 集 树 中 从 该 叶 结 点 开始 沿 结 点 父 指 
针 逐 步 构造 出 来 。 具 体 算法 可 描述 如 下 : 


public static int maxLoading(int [] w, int c, int [] bestx) 
{// 优 先 队列 式 分 支 限界 法 ,返回 最 优 载 重量 ,bestx 返回 最 优 解 


heap = new MaxHeap(); 


// 初 始 化 

int n 一 w. length 一 1; 

BBnode e=null; // 当 前 扩展 结 点 

int i 一 1; // 当 前 扩展 结 点 所 处 的 层 
int ew=0; // 扩 展 结 点 所 相应 的 载重 量 


// 定 义 剩余 重量 数组 r 

int[Jr=new int[n+1]; 

for (int j=n—1; j>0; j——) 
r[j]=r0+1]+wDi+1]; 
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// 搜 索 子 集 空间 树 
while (i ! 一 n 十 1) 
{// 非 叶 结 点 
// 检 查 当前 扩展 结 点 的 儿子 结 点 
if Cew 十 w[ 训 < 一 c) 
// 左 儿子 结 点 为 可 行 结 点 
addLiveNode(ew+ w[i]+r[i], i+1, e, true); 


// 右 儿子 结 点 总 为 可 行 结 点 
addLiveNode(ewt+r[i], i+1, e, false); 


// 取 下 一 扩展 结 点 

HeapNode node= (HeapNode) heap. removeMax(); 
i= node. level; 

e=node. liveNode; 

ew= node. uweight—r[i—1]; 


} 


// 构 造 当 前 最 优 解 

for (int j=n; j>0; j 一 一 ) 

{ 
bestx[j]= (e. leftChild) ? 1 : 0; 
e 一 e. parent; 

} 

return ew; 


} 

变量 bestw 用 来 记录 当前 子 集 树 中 可 行 结 点 所 相应 的 重量 的 最 大 值 。 当 前 活 结 点 优先 
队列 中 可 能 包含 某 些 结 点 的 uweight 值 小 于 bestw, 以 这 些 结 点 为 根 的 子 树 中 肯定 不 含 最 
优 解 。 如 果 不 及 时 将 这 些 结 点 从 优先 队列 中 删 去 , 则 一 方面 耗费 优先 队列 的 空间 资源 , 另 一 
方面 增加 执行 优先 队列 的 插入 和 删除 操作 的 时 间 。 为 了 避免 产生 这 些 无 效 活 结 点 ,可 以 在 
活 结 点 插入 优先 队列 前 测试 uweight 之 bestw。 通 过 测试 的 活 结 点 才 插入 优先 队列 中 。 这 
样 做 可 以 避免 产生 一 部 分 无 效 活 结 点 。 然 而 随 着 bestw 不 断 增加 ,插入 时 有 效 的 活 结 点 ,可 
能 变 成 当前 无 效 活 结 点 。 因 此 ,为 了 及 时 删除 由 于 bestw 的 增加 而 产生 的 无 效 活 结 点 ,即使 
uweight< bestw 的 活 结 点 , 要求 优先 队列 除了 支持 put, removeMax 运算 外 ,还 支持 
removeMin 运算 。 这 样 的 优先 队列 称 为 双 端 优先 队列 。 有 多 种 数据 结构 可 有 效 地 实现 双 
端 优 先 队列 。 


6.4 布线 问题 


印刷 电路 板 将 布线 区 域 划 分 成 nXn 个 方 格 阵 列 如 图 6-3(a) 所 示 。 精 确 的 电路 布线 问 
题 要 求 确 定 连 接 方 格 a 的 中 点 到 方 格 b 的 中 点 的 最 短 布线 方案 。 在 布线 时 ,电路 只 能 沿 直 
线 或 直角 布线 ,如 图 6-3(b) 所 示 。 为 了 避免 线路 相交 ,已 布 了 线 的 方 格 做 了 封锁 标记 ,其 他 
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线路 不 允许 穿 过 被 封锁 的 方 格 。 


(a) (b) 
6-3 印刷 电路 板 布线 方 格 阵列 


下 面 讨论 用 队列 式 分 支 限界 法 来 解 布线 问题 。 布 线 问 题 的 解 空间 是 一 个 图 。 解 此 问题 
的 队列 式 分 支 限界 法 从 起 始 位 置 a 开始 将 它 作为 第 一 个 扩展 结 点 。 与 该 扩展 结 点 相 邻 并 且 
可 达 的 方 格 成 为 可 行 结 点 被 加 入 到 活 结 点 队列 中 ,并且 将 这 些 方 格 标记 为 1, 即 从 起 始 方 格 
a 到 这 些 方 格 的 距离 为 1。 接 着 ,算法 从 活 结 点 队列 中 取出 队 首 结 点 作为 下 一 个 扩展 结 点 ， 
并 将 与 当前 扩展 结 点 相 邻 且 未 标记 过 的 方 格 标记 为 2, 并 存 入 活 结 点 队列 。 这 个 过 程 一 直 
继续 到 算法 搜索 到 目标 方 格 b 或 活 结 点 队列 为 空 时 为 止 。 

在 实现 上 述 算法 时 ,首先 定义 一 个 表示 电路 板 上 方 格 位 置 的 类 Position, 它 的 两 个 私有 
成 员 row 和 col 分 别 表示 方 格 所 在 的 行 和 列 。 在 电路 板 的 任何 一 个 方 格 处 ,布线 可 沿 右 、 
下 \ 左 、 上 4 个 方向 进行 。 沿 这 4 个 方向 的 移动 分 别 记 为 移动 0,1,2,3。 在 表 6-1 中 ,offset 
[站 .row 和 offset[ 站 . col(i 二 0,1,2,3) 分 别 给 出 沿 这 4 个 方向 前 进 1 步 相 对 于 当前 方 格 的 
相对 位 移 。 

表 6-1 移动 方向 的 相对 位 移 
移动 i 方向 offset[i]. row offset[i]. col 


在 实现 上 述 算法 时 .用 二 维 数组 grid 表示 所 给 的 方 格 阵 列 。 初 始 时 ,grid[ 刀 [jj]==0, 表 
示 该 方 格 允许 布线 ;而 gridLi][L 门 =1 表示 该 方 格 被 封锁 ,不 允许 布线 。 为 了 便于 处 理 方 格 
边界 的 情况 ,算法 在 所 给 方 格 阵列 四 周 设置 一 道 “ 围 墙 >, 即 增设 标记 为 “1 的 附加 方 格 。 算 
法 开始 时 测试 初始 方 格 与 目标 方 格 是 否 相同 。 如 果 这 两 个 方 格 相同 , 则 不 必 计算 ,直接 返回 
最 短 距离 0; 和 否则 ,算法 设置 方 格 阵 列 的 “围墙 ”, 初 始 化 位 移 矩 阵 offset。 算 法 将 起 始 位 置 的 
距离 标记 为 2。 由 于 数字 0 和 1 用 于 表示 方 格 的 开放 或 封锁 状态 ,所 以 在 表示 距离 时 不 用 
这 两 个 数字 ,因而 将 距离 的 值 都 加 2。 实 际 距离 应 为 标记 距离 减 2。 算 法 从 起 始 位 置 start 
开始 ,标记 所 有 标记 距离 为 3 的 方 格 并 存 入 活 结 点 队列 ,然后 依次 标记 所 有 标记 距离 为 4， 
5,… 的 方 格 ,直至 到 达 目 标 方 格 finish 或 活 结 点 队列 为 空 时 为 止 。 具 体 算 法 可 描述 如 下 : 

public class WireRouter 

{ 


private static class Position 


CO) 
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Private int row; // 方 格 所 在 的 行 
private int col; // 方 格 所 在 的 列 


了 Position(int rr，int cc) 


{ 
row = Ir; 
col = cc 
} 
private static int [J[] grid; // 方 格 阵列 
Private static int size; // 方 格 阵列 大 小 
private static int pathLen; // 最 短线 路 长 度 length of shortest wire path 
Private static ArrayQueue q; // 扩 展 结 点 队列 
private static Position start, // 起 点 
finish; // 终 点 
private static Position [] path; // 最 短路 


private static void inputData() 
{ 
MyInputStream keyboard==new MyInputStream(); 
System. out. println("Enter grid size”); 
size= keyboard. readInteger(); 
System. out, println("Enter the start position ) ; 
start= new Position(keyboard. readInteger() keyboard. readInteger()); 
System. out. println("Enter the finish position )， 
finish= new Position(keyboard. readInteger(), keyboard. readInteger()); 
grid 一 new int [size 十 2][size 十 2]; 
System. out. println("Enter the wiring grid in row-major order ); 
for (int i=1; i<= size; i 十 十 ) 
for (int j=1; j<= size; j 十 十 ) 
grid[i][j]= keyboard. readInteger(); 


private static boolean findPath() 
{ // 计 算 从 起 始 位 置 start 到 目标 位 置 finish 的 最 短 布线 路 径 
// 找 到 最 短 布线 路 径 则 返回 true, 否 则 返回 false 


finish. row) && (start. col 一 一 finish. col)) 


if ((start. row 
{//start== finish 
pathLen=0; 


return true; 


// 初 始 化 相对 位 移 


Position [] offset=new Position [4]; 
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offset[0] 王 new Position(0, 1); // 右 第 
offset[1]=new Position(1, 0); Ft 6 
offset[2] 王 new Position(0, —1); // 左 章 
offset[3]=new Position(—1, 0); AE 
// 设 置 方 格 阵列 “围墙 ” 
for (int i=0; i<= size+1; i 十 十 ) 
{ 

grid[0J[i]= grid[size+1]J[i]=1; // 顶 部 和 底部 

grid[i][0]=grid[i][size+1]=1; // 左 融和 右翼 


Position here 一 new Position(start. row, start. col); 


grid[ start. row J[ start. col ]=2; // 起 始 位 置 的 距离 
int numOf{Nbrs=4; // 相 邻 方 格 数 
// 标 记 可 达 方 格 位 置 


ArrayQueue q 一 new ArrayQueue(); 
了 Position nbr 一 new Position(0, 0); 
do 
{// 标 记 可 达 相 邻 方 格 
for (int i=0; i < numOfNbrs; i 十 十 ) 
{ 
nbr. row= here. row +offset[i]. row; 
nbr. col= here. col+offset[i]. col; 
if (gridLnbr. rowJ[nbr. col]==0) 
{ // 该 方 格 未 标记 
gridLnbr. row][Lnbr. col]= grid[here. row J[here. co 十 1; 
证 (Cnbr. row 一 一 finish. row) && (nbr. col==finish. col)) break; // 完 成 
q. put(new Position(nbr. row, nbr. col)); 


} 


// 是 否 到 达 目 标 位 置 finish 
if ((nbr. row==finish. row) && (nbr. col==finish. col)) break; // 完 成 


// 活 结 点 队列 是 否 非 空 

if (q.isEmpty()) return false; // 无 解 

here= (Position) q. remove(); // 取 下 一 个 扩展 结 点 
} while(true); 
// 构 造 最 短 布线 路 径 


pathLen= grid[finish. row][finish. col]—2; 
path 一 new Position [pathLen]; 
// 从 目标 位 置 finish 开始 向 起 始 位 置 回溯 


here= finish; 
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for (int j 一 pathLen 一 1; j 之 一 0; j 一 一 ) 
{ 
path[j] = here; 
// 找 前 驱 位 置 
for (int i=0; i<numOfNbrs; i 十 十 ) 
{ 
nbr. row= here. row++ offset[i]. row; 
nbr. col= here. col+offset[i]. col; 
if (grid[ nbr. row [nbr. col]==j+2) break; 
} 
here 一 new Position(nbr. row，nbr. coD); // 向 前 移动 
} 
return true; 
} 
} 


图 6-4 是 在 一 个 7X7 方 格 阵列 中 布线 的 例子 。 其 中 ,起 始 位 置 a 是 (3,2) ,目标 位 置 b 
是 (4,6) ,阴影 方 格 表示 被 封锁 的 方 格 。 当 算法 搜索 到 目标 方 格 b 时 ,将 目标 方 格 b 标记 为 
从 起 始 位 置 a 到 上 b 的 最 短 距离 。 在 上 例 中 ,a 到 b 的 最 短 距离 是 9。 要 构造 出 与 最 短 距离 相 
应 的 最 短路 径 , 可 以 从 目标 方 格 开始 向 起 始 方 格 方向 回溯 ,逐步 构造 出 最 优 解 。 每 次 向 标记 
的 距离 比 当 前 方 格 标记 距离 少 1 的 相 邻 方 格 移动 ,直至 到 达 起 始 方 格 时 为 止 。 在 图 6-4(a) 
所 示 的 标记 距离 的 例子 中 ,从 目标 方 格 b 移 到 (5,6) ,然后 移 至 (6,6)…… 最 终 移 至 起 始 方 格 
a, 得 到 相应 的 最 短路 径 如 图 6-4(b) 所 示 。 


o|~|o|= 


(b) 


图 6-4 布线 算法 示例 


由 于 每 个 方 格 成 为 活 结 点 进入 活 结 点 队列 最 多 1 次 ,因此 活 结 点 队列 中 最 多 只 处 理 
OGmn) 个 活 结 点 。 扩 展 每 个 结 点 需 O(1) 时 间 , 因 此 算法 共 耗 时 O(mn)。 构 造 相 应 的 最 短 
距离 需要 O(L) 时 间 , 其 中 工 是 最 短 布线 路 径 的 长 度 。 


6.5 0-1 背包 问题 


在 下 面 所 描述 的 解 0-1 背包 问题 的 优先 队列 式 分 支 限 界 法 中 , 活 结 点 优先 队列 中 结 点 
元 素 N 的 优先 级 由 该 结 点 的 上 界 函 数 bound 计算 出 的 值 uprofit 给 出 。 该 上 界 函 数 已 在 讨 
论 解 0-1 背包 问题 的 回溯 法 时 讨论 过 。 子 集 树 中 以 结 点 node 为 根 的 子 树 中 任 一 结 点 的 价 
值 不 超过 node. profit。 因 此 用 一 个 最 大 堆 来 实现 活 结 点 优先 队列 。 堆 中 元 素 类 型 为 
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HeapNode, 其 私有 成 员 有 uprofit, profit, weight 和 level。 对 于 任意 一 个 活 结 点 node， 
node. weight 是 结 点 node 所 相应 的 重量 ;node. profit 是 node 所 相应 的 价值 ;node. uprofit 
是 结 点 node 的 价值 上 界 ,最 大 堆 以 这 个 值 作为 优先 级 。 子 集 空 间 树 中 结 点 类 型 为 BBnode。 


static class BBnode 


{ 


BBnode parent; // 父 结 点 
boolean leftChild; // 左 儿子 结 点 标志 


BBnode( BBnode par, boolean ch) 
{ 
Parent= par; 


leftChild= ch; 


static class HeapNode implements Comparable 
{ 


BBnode liveNode; // 活 结 点 

double upperProfit; // 结 点 的 价值 上 界 

double profit; // 结 点 所 相应 的 价值 

double weight; // 结 点 所 相应 的 重量 

int level; // 活 结 点 在 子 集 树 中 所 处 的 层 序号 
// 构 造 方法 


HeapNode(BBnode node, double up, double pp, double ww, int lev) 
{ 

liveNode= node; 

upperProfit= up; 

profit= pp; 

weight= ww; 


level=lev; 


public int compareTo(Object x) 

{ 
double xup= ((HeapNode) x). upperProfit; 
if (upperProfit<xup) return 一 1; 
if CupperProfit 一 一 xup) return 0; 


return 1; 


private static class Element implements Comparable 
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上 


int id; // 编 号 
double d; // 单 位 重量 价值 
// 构 造 方法 


private Element(int idd, double dd) 
{ 

id=idd; 

d=dd; 
} 


public int compareTo(Object x) 
{ 
double xd= ((Element) x).d; 
if (d<xd) return—1; 
if (d== xd) return 0; 


return 1; 


public boolean equals(Object x) 
{return d==((Element) x).d;} 


算法 中 用 到 的 类 BBKnapsack 与 解 0-1 背包 问题 的 回溯 法 中 用 到 的 类 Knapsack 十 分 
相似 。 它 们 的 区 别 是 新 的 类 中 没有 成 员 变 量 bestp ,而 增加 了 新 的 成 员 bestx。bestx[i 二 1 
当 且 仅 当 最 优 解 含 有 物品 i。 


public class BBKnapsack 


{ 


} 


static double c; // 背 包容 量 

static int ni // 物 品 总 数 

static double [] w; // 物 品 重量 数组 
static double [] p; // 物 品 价 值 数组 
static double cwi // 当 前 重量 

static double cp; // 当 前 价值 

static int [] bestx; // 最 优 解 

static MaxHeap heap; // 活 结 点 优先 队列 


上 界 函 数 bound 计算 结 点 所 相应 价值 的 上 界 。 


Private static double bound(int i) 


{ 


// 计 算 结 点 所 相应 价值 的 上 界 
double cleft 一 c 一 cwi; // 剩 余 容 量 
double b=cp; // 价 值 上 界 


// 以 物品 单位 重量 价值 递减 序 装填 剩余 容量 
while (i<—n && w[i]<— cleft) 


分 支 腿 界 法 


( 第 
cleft 一 一 w[i]; 6 
b+=p[i]; 章 
计 十 ; 

// 装 填 剩余 容量 装 满 背包 

if (i<=mb+=p[i]/wLi] * cleft; 

return b; 


’ 
addLiveNode 将 一 个 新 的 活 结 点 插入 到 子 集 树 和 优先 队列 中 。 


private static void addLiveNode( double up, double pp， 
double ww, int lev, BBnode par, boolean ch) 
{  // 将 一 个 新 的 活 结 点 插入 到 子 集 树 和 最 大 堆 H 中 
BBnode b=new BBnode(par, ch); 
HeapNode node=new HeapNode(b, up, pp, ww, lev); 
heap. put(node); 
; 


算法 bbKnapsack 实施 对 子 集 树 的 优先 队列 式 分 支 限 界 搜索 。 其 中 ,假定 各 物品 依 其 
单位 重量 价值 从 大 到 小 排 好 序 。 相 应 的 排序 过 程 可 在 算法 的 预 处 理 部 分 完成 。 

算法 中 enode 是 当前 扩展 结 点 ;cw 是 该 结 点 所 相应 的 重量 ;cp 是 相应 的 价值 ;up 是 价 
值 上 界 。 算 法 的 while 循环 不 断 扩展 结 点 ,直到 子 集 树 的 一 个 叶 结 点 成 为 扩展 结 点 时 为 止 。 
此 时 优先 队列 中 所 有 活 结 点 的 价值 上 界 均 不 超过 该 叶 结 点 的 价值 。 因 此 ,该 叶 结 点 相应 的 
解 为 问题 的 最 优 解 。 

在 while 循环 内 部 ,算法 首先 检查 当前 扩展 结 点 的 左 儿 子 结 点 的 可 行 性 。 如 果 该 左 儿 
子 结 点 是 可 行 结 点 , 则 将 它 加 入 到 子 集 树 和 活 结 点 优先 队列 中 。 当 前 扩展 结 点 的 右 儿 子 结 
点 一 定 是 可 行 结 点 , 仅 当 右 儿子 结 点 满足 上 界 约 束 时 才 将 它 加 入 子 集 树 和 活 结 点 优先 队列 。 

算法 bbKnapsack 具体 描述 如 下 : 

private static double bbKnapsack() 

{// 优 先 队列 式 分 支 限界 法 ,返回 最 大 价值 ,bestx 返回 最 优 解 

// 初 始 化 


BBnode enode 一 null; 


int i=1; 
double bestp=0. 0; // 当 前 最 优 值 
double up= bound(1); // 价 值 上 界 


// 搜 索 子 集 空间 树 
while (il =n+1) 
{// 非 叶 结 点 
// 检 查 当 前 扩展 结 点 的 左 儿 子 结 点 
double wt=cw+t+ w[i]; 
if (wt<=¢) 
{// 左 儿子 结 点 为 可 行 结 点 


算法 设计 与 分 折 ( 蓄 了 版 ) 


if (cp+p[i]>bestp) 
bestp=cp+p[i]; 
addLiveNode(up,cp+p[i],cw+ w[i],i+1, enode, true); 
} 
up 一 bound(i 十 1); 
// 检 查 当前 扩展 结 点 的 右 儿 子 结 点 
if (up> = bestp) 
// 右 子 树 可 能 含 最 优 解 
addLiveNode(up,cp,cw,i+1, enode, false); 
// 取 下 一 扩展 结 点 
HeapNode node= (HeapNode) heap. removeMax(); 
enode= node. liveNode; 
cw 一 node. weight; 
cp 一 node. profit; 
up 一 node. upperProfit; 
i= node. level; 
} 
// 构 造 当前 最 优 解 
for (int j=n; j>0; j 一 一 ) 
{ 
bestx[j]= (enode. leftChild) ? 1 : 0; 
enode= enode. parent; 
} 
return cp; 


下 面 的 算法 knapsack 完成 对 输入 数据 的 预 处 理 。 主 要 任务 是 将 各 物品 依 其 单位 重量 
价值 从 大 到 小 排 好 序 。 然 后 调用 bbKnapsack 完成 对 子 集 树 的 优先 队列 式 分 支 限界 搜索 。 


public static double knapsack(double [] pp, double [] ww, double cc, int [] xx) 
{// 返 回 最 大 价值 ,bestx 返回 最 优 解 
c 一 cci 


n=pp. length 一 1; 


// 定 义 依 单位 重量 价值 排序 的 物品 数组 
Element [] q=new Element [n]; 
double ws 一 0.0; // 装 包 物 品 重量 
double ps 一 0.0; // 装 包 物 品 价值 
for (int i=1; i<=n; i 十 十 ) 
{ 
qLi —1]=new Element(i, pp[i] / ww[i]); 
ps+=pp[i]; 
wst+=ww[i]; 


’ 


让 (ws< 二 c) // 所 有 物品 装 包 


分 支 腿 界 法 


{ 
for (int i=1; i<=n; i 十 十 ) 
xx[i]=1; 
return ps; 


} 


// 依 单位 重量 价值 排序 
MergeSort. mergeSort(q); 


// 初 始 化 类 数据 成 员 
p=new double [n + 1]; 
w=new double [n + 1]; 
for (int i=1; i<=n; i++) 
{ 
pLi]=ppLaLn—i]. id]; 
w[i]=ww[Lg[Ln—i. id]; 
} 
cw=0.0; 
cp=0.0; 
bestx=new int [n 十 1]; 


heap=new MaxHeap(); 


// 调 用 bbKnapsack 求 问题 的 最 优 解 

double maxp= bbKnapsack(); 

for (int i 一 1 } i<=n; i 十 十 ) 
xx[q[n—i].id]= bestx[i]; 


return maxp; 


6.6 最 大 团 问题 


最 大 团 问 题 的 解 空间 树 是 一 棵 子 集 树 。 解 最 大 团 问 题 的 优先 队列 式 分 支 限界 法 与 解 装 
载 问题 的 优先 队列 式 分 支 限 界 法 相似 。 算 法 构造 的 解 空间 树 中 结 点 类 型 是 BBnode; 活 结 点 
优先 队列 中 元 素 类 型 为 HeapNode。 每 一 个 HeapNode 类 型 的 结 点 都 用 变量 cliqueSize 表 
示 与 该 结 点 相应 的 团 的 项 点数;upperSize 表示 该 结 点 为 根 的 子 树 中 最 大 项 点数 的 上 界 ; 
level 表示 结 点 在 子 集 空间 树 中 所 处 的 层次 ;用 cliqueSize 十 2 一 level 十 1 作为 顶点 数 上 界 
upperSize 的 值 。 由 此 ,可 省 去 一 个 变量 cliqueSize 或 level ,因为 从 upperSize 的 值 可 推出 省 
去 变量 的 值 。upperSize 实际 上 也 是 优先 队列 中 元 素 的 优先 级 。 算 法 总 是 从 活 结 点 优先 队 
列 中 抽取 具有 最 大 upperSize 值 的 元 素 作 为 下 一 个 扩展 元 素 。 

static class BBnode 


BBnode parent; // 父 结 点 
boolean leftChild; // 左 儿子 结 点 标志 
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// 构 造 方法 
BBnode( BBnode par, boolean ch) 
{ 

parent= par; 

leftChild= ch; 


static class HeapNode implements Comparable 


{ 


} 


BBnode liveNode; 


int upperSize; // 当 前 团 最 大 项 点 数 的 上 界 

int cliqueSize; // 当 前 团 的 顶点 数 

int level; // 结 点 在 子 集 空间 树 中 所 处 的 层次 
// 构 造 方法 


HeapNode(BBnode node, int up, int size, int lev) 
liveNode= node; 
upperSize= up; 
cliqueSize= size; 


level= lev; 


public int compareTo(Object x) 

{ 
int xup= ((HeapNode) x). upperSize; 
if (upperSize< xup) return—1; 
if (upperSize== xup) return 0; 


return 1; 


在 具体 实现 时 ,用 邻接 矩阵 表示 所 给 的 图 G。 在 类 BBClique 中 用 二 维 数组 a 存储 图 G 
的 邻接 矩阵 。 


public class BBClique 


{ 


} 


static boolean [J[] a; // 图 G 的 邻接 矩阵 
static MaxHeap heap; // 活 结 点 优先 队列 


算法 中 addLiveNode 的 功能 是 将 当前 构造 出 的 活 结 点 加 入 到 子 集 空 间 树 中 并 插入 活 
结 点 优先 队列 中 。 


分 支 腿 囚 法 


Private static void addLiveNode(int up, int size, int lev, BBnode par，boolean ch) 
{// 将 活 结 点 加 入 到 子 集 空间 树 中 并 插 人 最 大 堆 中 

BBnode b=new BBnode(par, ch); 

HeapNode node=new HeapNode(b, up, size, lev); 

heap. put(node); 
} 


算法 bbMaxClique 具体 实现 对 子 集 解 空间 树 的 最 大 优先 队列 式 分 支 限界 搜索 。 子 集 
树 的 根 结 点 是 初始 扩展 结 点 。 对 于 这 个 特殊 的 扩展 结 点 ,其 cliqueSize 的 值 为 0。 变 量 ; 用 
于 表示 当前 扩展 结 点 在 解 空 间 树 中 所 处 的 层次 。 因 此 ,初始 时 扩展 结 点 所 相应 的 i 值 为 1， 
当前 最 大 团 的 顶点 数 存储 于 变量 bestn 中 。 
在 算法 的 while 循环 中 ,不 断 从 活 结 点 优先 队列 中 抽取 当前 扩展 结 点 并 实施 对 该 结 点 
的 扩展 。 算 法 的 while 循环 的 终止 条 件 是 遇 到 子 集 树 中 的 一 个 叶 结 点 ( 即 ”十 1 层 结 点 ) 成 
为 当前 扩展 结 点 。 对 于 子 集 树 中 的 叶 结 点 ,有 upperSize 二 cliqueSize。 此 时 , 活 结 点 优先 队 
列 中 剩余 结 点 的 upperSize 值 均 不 超过 当前 扩展 结 点 的 upperSize 值 , 从 而 进一步 搜索 不 可 
能 得 到 更 大 的 团 。 换 名 话说 ,此 时 算法 已 找到 一 个 最 优 解 。 
算法 在 扩展 内 部 结 点 时 ,首先 考查 其 左 儿 子 结 点 。 在 左 儿子 结 点 处 ,将 项 点 i 加 入 到 当 
前 团 中 ,并 检查 该 项 点 与 当前 团 中 其 他 顶点 之 间 是 否 有 边 相 连 。 当 顶点 i 与 当前 团 中 所 有 
顶点 之 间 都 有 边 相 连 , 则 相应 的 左 儿 子 结 点 是 可 行 结 点 ;否则 ,就 不 是 可 行 结 点 。 为 了 检测 
左 儿 子 结 点 的 可 行 性 ,算法 从 当前 扩展 结 点 开始 向 根 结 点 回溯 ,确定 当前 团 中 的 顶点 ,同时 
检查 当前 团 中 的 项 点 与 顶点 i 的 连接 情况 。 如 果 经 检测 , 左 儿 子 结 点 是 可 行 结 点 , 则 将 它 加 
和 人 到 子 集 树 中 并 插入 活 结 点 优先 队列 。 接 着 算法 继续 考查 当前 扩展 结 点 的 右 儿子 结 点 。 当 
upperSize 二 bestn 时 , 右 子 树 中 可 能 含有 最 优 解 , 此 时 将 右 儿 子 结 点 加 入 到 子 集 树 中 并 插入 
到 活 结 点 优先 队列 中 。 
由 于 每 一 个 图 都 有 最 大 团 ,因此 ,在 从 最 大 堆 中 抽取 极 大 元 素 时 不 必 测 试 堆 是 否 为 空 。 
算法 的 while 循环 仅 当 遇 到 叶 结 点 时 退出 。 
public static int bbMaxClique(int [] bestx) 
{// 解 最 大 团 问题 的 优先 队列 式 分 支 限界 法 
int n= bestx. length 一 1; 
heap 一 new MaxHeap(); 
// 初 始 化 
BBnode enode=null; 
int i=1; 
int cn 一 0; 
int bestn 一 0; 
// 搜 索 子 集 空间 树 
while (i ! =n+1) 
{// 非 叶 结 点 
// 检 查 顶 点 i 与 当前 团 中 其 他 顶点 之 间 是 否 有 边 相 连 
boolean ok= true; 
BBnode bnode = enode; 


for (int j=i—1; j>0; bnode= bnode. parent, j——) 
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if (bnode. leftChild && !a[ 训 Dj]) 
{ 
ok 一 false; 
break; 
if (ok) 
{// 左 儿子 结 点 为 可 行 结 点 
if (cn 十 1 之 bestn) bestn 一 cn 十 1; 
addLiveNode(cn 十 n 一 i 十 1， cn 十 1, i+1, enode, true); 
if (cn 十 n 一 之 一 bestn) 
// 右 子 树 可 能 含 最 优 解 
addLiveNode(cn+n—i, cn, i+1, enode, false); 
// 取 下 一 扩展 结 点 
HeapNode node= (HeapNode) heap. removeMax(); 
enode= node. liveNode; 
cn 一 node. cliqueSize; 
i= node. level; 
} 
// 构 造 当前 最 优 解 
for (int j=n; j>0; j——) 
| 
bestx[j]= (enode. leftChild) ? 1 : 0; 
enode= enode. parent; 
} 


return bestn; 


6.7 旅行 售货员 问题 


旅行 售货员 问题 的 解 空间 树 是 一 棵 排列 树 。 与 前 面 关 于 子 集 树 的 讨论 类 似 , 实 现 对 排 
列 树 搜索 的 优先 队列 式 分 支 限 界 法 也 可 以 有 两 种 不 同 的 实现 方式 。 一 种 实现 方式 是 仅 使 用 
优先 队列 来 存储 活 结 点 。 优 先 队 列 中 的 每 个 活 结 点 都 存储 从 根 到 该 活 结 点 的 相应 路 径 。 另 
一 种 实现 方式 是 用 优先 队列 来 存储 活 结 点 ,并 同时 存储 当前 已 构造 出 的 部 分 排列 树 。 在 这 
种 实现 方式 下 ,优先 队列 中 的 活 结 点 就 不 必 再 存储 从 根 到 该 活 结 点 的 相应 路 径 。 这 条 路 径 
可 在 必要 时 从 存储 的 部 分 排列 树 中 获得 。 在 下 面 的 讨论 中 采用 第 一 种 实现 方式 。 

在 具体 实现 时 ,用 邻接 矩阵 表示 所 给 的 图 G。 在 类 BBTSP 中 用 二 维 数组 a 存储 图 G 
的 邻接 矩阵 。 

public class BBTSP 

{ 

private static class HeapNode implements Comparable 


{ 
float lcost， // 子 树 费 用 的 下 界 


ce, // 当 前 费用 

rcost; //xLs:n 一 1] 中 顶点 最 小 出 边 费 用 和 
int s; // 根 结 点 到 当前 结 点 的 路 径 为 x[0:s] 
int [] x; // 需 要 进一步 搜索 的 顶点 是 x[s 十 1:n 一 1] 
// 构 造 方法 


HeapNode(float le, float ccc, float rc, int ss, int [] xx) 
{ 

lcost = lc; 

cc 一 cccy 

SS 一 SS; 

X 一 Xx; 


} 


public int compareTo(Object x) 

{ 
float xlc= ((HeapNode) x). lcost; 
if (lcost<xlc) return—1; 
if (lcost== xlc) return 0; 
return 1; 

} 

i 


static float [][] a; // 图 G 的 邻接 矩阵 


分 支 腿 界 法 


由 于 要 找 的 是 最 小 费用 旅行 售货员 回路 ,所 以 选用 最 小 堆 表 示 活 结 点 优先 队列 。 最 小 
堆 中 元 素 的 类 型 为 HeapNode。 该 类 型 结 点 包含 域 z, 用 于 记录 当前 解 ;s 表示 结 点 在 排列 
树 中 的 层次 ,从 排列 树 的 根 结 点 到 该 结 点 的 路 径 为 z[0:s], 需 要 进一步 搜索 的 项 点 是 zx[s 十 
1:n 一 1]。cc 表示 当前 费用 ,lcost 是 子 树 费用 的 下 界 ,rcost 是 z[s:n 一 1 中 顶点 最 小 出 边 费 


用 和 。 


具体 算法 可 描述 如 下 。 


算法 开始 时 创建 一 个 最 小 堆 , 用 于 表示 活 结 点 优先 队列 。 堆 中 每 个 结 点 的 lcost 值 是 优 
先 队 列 的 优先 级 。 接 着 算法 计算 出 图 中 每 个 项 点 的 最 小 费用 出 边 并 用 minout 记录 。 如 果 
所 给 的 有 向 图 中 某 个 顶点 没有 出 边 , 则 该 图 不 可 能 有 回路 ,算法 即 告 结束 。 如 果 每 个 顶点 都 
有 出 边 , 则 根据 计算 出 的 minout 做 算法 初始 化 。 算 法 的 第 1 个 扩展 结 点 是 排列 树 中 根 结 点 
的 唯一 儿子 结 点 (图 5-1 中 结 点 B)。 在 该 结 点 处 ,已 确定 的 回路 中 唯一 顶点 为 项 点 1。 因 


此 ,初始 时 有 s==0,zx[0]=1,zx[1:n 一 1]==(2,3,*…,n),cc=0 且 rcost 一 Dy minout[] 。 算 
法 中 用 bestc 记录 当前 优 值 。 


public static float bbTSP(int vL]) 
{// 解 旅行 售货员 问题 的 优先 队列 式 分 支 限界 法 


int n=v. length 一 1; 
MinHeap heap=new MinHeap(); 
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//minOut[ 训 = 顶点 i 的 最 小 出 边 费 用 
float [] minOut=new float [n 十 1]; 
float minSum 王 0; // 最 小 出 边 费 用 和 
for (int i=1; i<=n; i++) 
{// 计 算 minOut[i] 和 minSum 
float min= Float. MAX_VALUE:; 
for (int j=1; j<=n; j 十 十 ) 
if (a[ 订 [让 天 Float MAX_VALUE && a[i 让 Dj] 一 min) 
min=a[i][0]; 
让 (min== Float. MAX_VALUE) return Float. MAX_VALUE; // 无 回路 
minOut[i]=min; 
minSum+= min; 
} 
// 初 始 化 
int [] x=new int [n]; 
for (int i=0; i<n; i++) x[i]=i+1; 
HeapNode enode=new HeapNode(0,0,minSum,0,x); 
float bestc= Float. MAX_VALUE; 
// 搜 索 排列 空间 树 
while (enode! 一 null &&. enode. s<n—1) 
{// 非 叶 结 点 
x= enode. x; 
if (enode. s 一 一 n 一 2) 
{// 当 前 扩展 结 点 是 叶 结 点 的 父 结 点 
// 再 加 2 条 边 构成 回路 
// 所 构成 回路 是 否 优 于 当前 最 优 解 
if (a[x[n 一 2]][x[n 一 1]] < Float. MAX_VALUE && 
a[Lx[n 一 1][1] < Float. MAX_VALUE && 
enode. cc+a[x[n—2]][x[Ln—1]]+aLx[Ln—1]J[1]<bestc) 
{// 找 到 费用 更 小 的 回路 
bestc= enode. cc 十 aLx[n 一 2]][x[n 一 1]] 十 aLx[n 一 1]][1]， 
enode. cc= bestc; 
enode. lcost= bestc; 
enode. s 十 十 ; 
heap. put(enode); 


} 
else 
{// 产 生 当前 扩展 结 点 的 儿子 结 点 
for (int i=enode. s 十 1; i<n; i 十 十 ) 
if (a[x[enode. s]J[x[i]] <Float. MAX_VALUE) 
{ 
// 可 行 儿子 结 点 
float cc 一 enode. cc 十 aLx[enode. sj]][x[i]]; 
float rcost 一 enode. rcost— minOut[ x[Lenode. s]]; 


分 支 腿 界 法 


float b 一 cc 十 rcost; // 下 界 
if (b 一 bestc) 
{// 子 树 可 能 含 最 优 解 , 结 点 插入 最 小 堆 
int [] xx 一 new int [n]; 
for (int j=0; j<n; j++) xx[j]=x[j]; 
xx[enode. s+1]=x[i]; 
xx[i]=xLenode. s+1]; 
HeapNode node=new HeapNode(b,cc,rcost, enode. s+1,xx); 
heap. put(node); 
} 
} 
} 
// 取 下 一 扩展 结 点 
enode= (HeapNode) heap. removeMin(); 
’ 
// 将 最 优 解 复制 到 v[1:n] 
for (int i=0; i<n; i 十 十 ) 
v[i+1]=x[]; 
return bestc; 


} 


算法 中 while 循环 的 终止 条 件 是 排列 树 的 一 个 叶 结 点 成 为 当前 扩展 结 点 。 当 s==n 一 1 
时 ,已 找到 的 回路 前 缀 是 xz[0:n 一 1, 它 已 包含 图 G 的 所 有 nn 个 顶点 。 因 此 , 当 s==n 一 1 时 ， 
相应 的 扩展 结 点 表示 一 个 叶 结 点 。 此 时 该 叶 结 点 所 相应 的 回路 的 费用 等 于 cc 和 lcost 的 
值 ,剩余 的 活 结 点 的 lcost 值 不 小 于 已 找到 的 回路 的 费用 ,它们 都 不 可 能 导致 费用 更 小 的 回 
路 。 因 此 ,已 找到 的 叶 结 点 所 相应 的 回路 是 一 个 最 小 费用 旅行 售货员 回路 ,算法 可 以 结束 。 

算法 的 while 循环 体 完成 对 排列 树 内 部 结 点 的 扩展 。 对 于 当前 扩展 结 点 ,算法 分 两 种 
情况 进行 处 理 。 首 先 考虑 =n 一 2 的 情形 。 此 时 当前 扩展 结 点 是 排列 树 中 某 个 叶 结 点 的 父 
结 点 。 如 果 该 叶 结 点 相应 一 条 可 行 回路 且 费 用 小 于 当前 最 小 费用 , 则 将 该 叶 结 点 插入 到 优 
先 队 列 中 ;和 否则 , 舍 去 该 叶 结 点 。 

当 sn 一 2 时 ,算法 依次 产生 当前 扩展 结 点 的 所 有 儿子 结 点 。 由 于 当前 扩展 结 点 所 相 
应 的 路 径 是 z[0:s], 其 可 行 儿 子 结 点 是 从 剩余 项 点 x[s 十 1:n 一 1] 中 选取 的 顶点 xz[ 门 , 且 
(z[sj,x[ 让 ) 是 所 给 有 向 图 G 中 的 一 条 边 。 对 于 当前 扩展 结 点 的 每 一 个 可 行 儿子 结 点 , 计 
算出 其 前 级 (zx[0:sj,zx[ 门 ) 的 费用 cc 和 相应 的 下 界 lcost。 当 lcost<bestc 时 ,将 这 个 可 行 
儿子 结 点 插入 到 活 结 点 优先 队列 中 。 

算法 结束 时 返回 找到 的 最 小 费用 ,相应 的 最 优 解 由 数组 v 给 出 。 


6.8 电路 板 排列 问题 


电路 板 排列 问题 的 解 空间 树 是 一 棵 排列 树 。 采 用 优先 队列 式 分 支 限界 法 找 出 所 给 电路 
板 的 最 小 密度 布局 。 算 法 中 用 一 个 最 小 堆 来 表示 活 结 点 优先 队列 。 最 小 堆 中 元 素 类 型 是 
HeapNode。 每 一 个 HeapNode 类 型 的 结 点 包含 域 ,用 来 表示 结 点 所 相应 的 电路 板 排 列 ;s 


CO) 


算法 设计 与 分 析 ( 和 区 芋 版 ) 


表示 该 结 点 已 确定 的 电路 板 排列 xz[L1:s];cd 表示 当前 密度 ;now[j] 表 示 z[1:sj] 中 所 含 连 接 
块 7 中 的 电路 板 数 。 具 体 算法 描述 如 下 。 


private static class HeapNode implements Comparable 


int ss //x[1:s] 是 当前 结 点 所 相应 的 部 分 排列 

int cd; //x[1:sj] 的 密度 

int [] now; //now[j] 是 x[1:s] 所 含 连 接 块 j 中 电路 板 数 
int [] x; //x[1:nj 记 录 电 路 板 排 列 

// 构 造 方法 


private HeapNode(int cdd, int [] noww, int ss, int [] xx) 
{ 

cd 一 cdd; 

now 一 noww# 

s 一 ss 

X 一 XX3 


public int compareTo(Object x) 
{ 
int xcd 一 ((HeapNode) x). cd; 
if (cd<xcd) return 一 1; 
if (cd== xcd) return 0; 


return 1; 


} 


算法 bbBoards 是 解 电路 板 排列 问题 的 优先 队列 式 分 支 限 界 法 的 主体 。 算 法 开始 时 ,将 
排列 树 的 根 结 点 置 为 当前 扩展 结 点 。 在 初始 扩展 结 点 处 还 没有 选 定 的 电路 板 , 故 ;二 0， 
cd 二 0,now[ 站 ==0,1 志 i 二 n。 且 数组 xz 初始 化 为 单位 排列 。 数 组 total 初始 化 为 total[ 门 等 
于 连接 块 i 所 含 电 路 板 数 。bestd 表示 当前 最 小 密度 ,bestx 是 相应 的 最 优 解 。 

算法 的 do-while 循环 完成 对 排列 树 内 部 结 点 的 有 序 扩展 。 在 do-while 循环 体内 算法 
依次 从 活 结 点 优先 队列 中 取出 具有 最 小 cd 值 的 结 点 作为 当前 扩展 结 点 ,并 加 以 扩展 。 如 果 
当前 扩展 结 点 的 cd 值 大 于 或 等 于 bestd, 则 优先 队列 中 其 余 活 结 点 都 不 可 能 导致 最 优 解 ,此 
时 算法 结束 。 

算法 将 当前 扩展 结 点 分 为 两 种 情形 处 理 。 首 先 考 虑 ;二 n 一 1 的 情形 ,此 时 已 排 定 z 一 1 
块 电路 板 , 故 当前 扩展 结 点 是 排列 树 中 的 一 个 叶 结 点 的 父 结 点 。z 表示 相应 于 该 叶 结 点 的 
电路 板 排列 ,计算 出 与 x 相应 的 密度 并 在 必要 时 更 新 当前 最 优 值 bestd 和 相应 的 当前 最 优 
解 bestx。 

当 sn 一 1 时 ,算法 依次 产生 当前 扩展 结 点 的 所 有 儿子 结 点 。 对 于 当前 扩展 结 点 的 每 
一 个 儿子 结 点 node, 计 算出 其 相应 的 密度 node. cd。 当 node. cd 一 bestd 时 ,将 该 儿子 结 点 
node 插入 到 活 结 点 优先 队列 中 。 而 当 node. cd 宇 bestd 时 ,以 node 为 根 的 子 树 中 不 可 能 有 
比 当前 最 优 解 bestx 更 好 的 解 , 故 可 将 结 点 node 舍 去 。 


分 支 腿 界 法 


public static int bbBoards(int [ J[ Jboard, int m, int [] bestx) 
{// 优 先 队 列 式 分 支 限界 法 解 电路 板 排 列 问 题 
int n= board. length 一 1; 
MinHeap heap=new MinHeap(); 
// 初 始 化 
HeapNode enode 一 new HeapNode(0, new int [m 十 1], 0, new int [n+1]); 
//total[ 训 = 连接 块 i 中 电路 板 数 
int [] total=new int [m 十 1]; 
for (int i=1; i< 一 ni i 十 十 ) 
{ 
enode. x[i]=i; // 初 始 排列 为 1,2,…，n 
for (int j=1; j<=m; j++) 
total[ 订 十 一 board [i]J[]; // 连 接 块 j 中 电路 板 数 
} 
int bestd 一 m 十 1; // 当 前 最 小 密度 
int [] x=null; 
do 
{// 结 点 扩展 
if (enode. s 一 一 n 一 1) 
{// 仅 一 个 儿子 结 点 
int ld=0; // 最 后 一 块 电路 板 的 密度 
for (int j=1; j<=m; j++) 
1d 十 一 board [enode. x[n]]Dj]; 
if (ld = bestd) 
{// 找 到 密度 更 小 的 电路 板 排列 
x=enode. x; 
bestd= Math. max(ld, enode. cd); 


} 
else 
{// 产 生 当前 扩展 结 点 的 所 有 儿子 结 点 
for (int i = enode. s 十 1; i<=n; i 十 十 ) 
{ 
HeapNode node=new HeapNode(0, new int [m 十 1], 0， 
new int [n 十 1]); 
for (int j=1; j< 一 mi; j 十 十 ) 
// 新 插入 的 电路 板 
node. now[j]=enode. now[j] 二 + board [enode. x[i] [0]; 
int ld 二 0; // 新 插入 电路 板 的 密度 
for (int j=1; j<=—=m; j 十 十 ) 
if (node. now[j]> 0 && total[j] ! =node. now[j]) 1d 十 十 ; 
node. cd= Math. max(ld, enode. cd); 
if (node. cd 一 bestd) 
{// 可 能 产生 更 好 的 叶 结 点 


node. s 一 enode. s 十 1; 
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for (int j=1; j< 一 ni; j 十 十 ) node. x[j]=enode. x[j]; 
node. x[node. s] 一 enode. x[i]; 
node. x[i]= enode. xLnode. s]; 
heap. put(node); 
} 
} 
} 
// 取 下 一 扩展 结 点 
enode= (HeapNode) heap. removeMin(); 
} while (enode! =null ®&&. enode. cd 一 bestd) ; 
for (int i=1; i<=n; i 十 十 ) bestx[i]= x[i]; 


return bestd; 


6.9 批 处 理 作 业 调 度 


给 定 个 作业 的 集合 本 三 {了 ,J，… ,J 了) ,每 一 个 作业 J; 都 有 两 项 任务 要 分 别 在 两 台 
机 器 上 完成 。 每 一 个 作业 必须 先 由 机 器 1 处 理 ,然后 再 由 机 器 2 处 理 。 作 业 J 需要 机 器 j 
的 处 理 时 间 为 ,i 二 1,2,…,n;j 二 1,2。 对 于 一 个 确定 的 作业 调度 , 设 FF; 是 作业 i 在 机 器 j 


上 完成 处 理 的 时 间 , 则 所 有 作业 在 机 器 2 上 完成 处 理 的 时 间 和 了 = Sp 称 为 该 作业 调度 
i=1 


的 完成 时 间 和 。 批 处 理 作业 调度 问题 要 求 对 于 给 定 的 个 作业 ,制定 最 佳作 业 调 度 方案 ,使 
其 完成 时 间 和 达到 最 小 。 

用 优先 队列 式 分 支 限 界 法 解 此 问题 。 由 于 要 从 个 作业 的 所 有 排列 中 找 出 有 最 小 完成 
时 间 和 的 作业 调度 ,所 以 批 处 理 作业 调度 问题 的 解 空间 树 是 一 棵 排列 树 。 对 于 批 处 理 作 业 
调度 问题 ,可 以 证 明 存在 最 佳作 业 调 度 使 得 在 机 器 1 和 机 器 2 上 作业 以 相同 次 序 完成 。 在 
作业 调度 问题 相应 的 排列 空间 树 中 ,每 一 个 结 点 e 都 对 应 于 一 个 已 安排 的 作业 集 MS {1， 
2,…,n)。 以 该 结 点 为 根 的 子 树 中 所 含 叶 结 点 的 完成 时 间 和 可 以 表示 为 


设 |M|=r, 且 LL 是 以 结 点 为 根 的 子 树 中 的 一 个 叶 结 点 ,相应 的 作业 调度 为 {pi， 
二 1,2,…,n) ,其 中 因 是 第 & 个 安排 的 作业 。 如 果 从 结 点 下 开始 到 叶 结 点 工 的 路 上 ,每 一 
个 作业 pi 在 机 器 1 上 完成 处 理 后 都 能 立即 在 机 器 2 上 开始 处 理 , 即 从 + 开始 ,机 器 1 没 
有 空闲 时 间 , 则 对 于 该 叶 结 点 L 有 

二 7 [Fi t+ Gn—k+ Di ttm] = Si 
i€M k=r+1 

如 果 不 能 做 到 上 面 这 一 点 , 则 S, 只 会 增加 ,从 而 有 了 > 

类 似 地 ,如 果 从 结 点 下 开始 到 结 点 工 的 路 上 ,从 作业 pu 开始 ,机 器 2 没有 空间 时 
间 , 则 


DD = 了 LmaxCF»p, ,Fipr + minCts )) 十 (nk 十 1)tzp] = Sz 
i€EM 


k=r+1 


分 支 腿 界 法 


同 理 可 知 ,S, 是 >)F 的 一 个 下 界 。 由 此 ,得 到 在 结 点 E 处 相应 子 树 中 叶 结 点 完成 时 
斌 M 
间 和 的 下 界 是 
f 兰 DF + maxlS1,S:) 


其 中 ,Si 与 S; 的 计算 依赖 于 叶 结 点 相应 的 作业 调度 {pi ,k= 二 1,2,…,n}。 注 意 到 如 果 选 
择 pi ,使 tp 在 k 宇 r 十 1 时 依 非 减 序 排列 , 则 S, 取得 极 小 值 S,。 同 理 如 果园 拌 pr 使 tzp 依 
非 减 序 排列 , 则 S, 取得 极 小 值 5, 。 因 此 ,Si 三 $1,S; 宇 $,, 且 S, 和 S; 与 叶 结 点 的 调度 无 
关 。 从 而 有 

j 宇 DF 二 max{S1,S,} 


i€EM 
这 可 以 作为 优先 队列 式 分 支 限 界 法 中 的 限界 函数 。 
算法 中 用 一 个 最 小 堆 来 表示 活 结 点 优先 队列 。 最 小 堆 中 元 素 类 型 是 HeapNode。 每 一 
个 HeapNode 类 型 的 结 点 包含 域 x, 用 来 表示 结 点 所 相应 的 作业 调度 。* 表示 该 结 点 已 安排 
的 作业 是 z[1:s]。f1 表示 当前 已 安排 的 作业 在 机 器 1 上 的 最 后 完成 时 间 ;f2 表示 当前 已 
安排 的 作业 在 机 器 2 上 的 最 后 完成 时 间 ;sf2 表示 当前 已 安排 的 作业 在 机 器 2 上 的 完成 时 间 
和 ;bb 表示 当前 完成 时 间 和 的 下 界 。 


private static class HeapNode implements Comparable 


{ 


int s» // 已 安排 作业 数 
sf2， // 当 前 机 器 2 上 的 完成 时 间 和 
bb; // 当 前 完成 时 间 和 下 界 
int [] f; // 红 1] 机 器 1 上 最 后 完成 时 间 ; f[2] 机 器 2 上 最 后 完成 时 间 
int [] xs // 当 前 作业 调度 
// 构 造 方法 
private HeapNode(int n) 
{ // 最 小 堆 结 点 初始 化 


x 一 new int [nj]; 
for (int i=0; i<n; i 十 十 ) x[i]=i; 
S 一 0; 
f=new int [3]; 
{[1]=0; 
f{[2]=0; 
sf2 一 0; 
bb=0; 
} 


private HeapNode( HeapNode e,int [] ef, int ebb,int n) 
{ // 最 小 堆 新 结 点 
x 一 new int [nj]; 
for (int i=0; i<n; i 十 十 ) 
x[i]=e. x[i]; 
f=ef; 
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sf2 一 e. sf2+f[2]; 
bb= ebb; 
s 一 e. s+1; 

} 


public int compareTo(Object x) 

{ 
int xbb= ((HeapNode) x). bb; 
if (bb<xbb) return—1; 
if (bb== xbb) return 0; 
return 1; 

} 


在 具体 实现 时 ,用 二 维 数组 m 表示 所 给 的 n 个 作业 在 机 器 1 和 机 器 2 所 需 的 处 理 时 
间 。 在 类 BBFlow 中 用 二 维 数组 4 存储 排 好 序 的 作业 处 理 时间 。 数 组 a 表示 数组 xm 和 4 的 
对 应 关系 。bestc 记录 当前 最 小 完成 时 间 和 ,bestx 记录 相应 的 当前 最 优 解 。 算 法 sort 实现 
对 各 作业 在 机 器 1 和 2 上 所 需 时 间 排 序 。 方 法 bound 用 于 计算 完成 时 间 和 下 界 。 


public class BBFlow 
{ 


static int ny // 作 业 数 

bestc; // 最 小 完成 时 间 和 
static int [J[] m; // 各 作业 所 需 的 处 理 时 间 数 组 
static int [][] b; // 各 作业 所 需 的 处 理 时 间 排 序数 组 
static int [J[] ay // 数 组 m 和 bb 的 对 应 关系 数组 
static int [] bestx; // 最 优 解 
static boolean [J[] y; // 工 作 数 组 


} 


private static void sort() 
{ // 对 各 作业 在 机 器 1 和 2 上 所 需 时 间 排 序 
int [] c=new int [nj]; 
for (int j=0;j<2;j+++) 
{ 
for (int i=0;i<n;it+) 
{ 
b[iJ0]=m[LiJ0]; 
cLi]=i; 
» 
for (int i=0;i<n—1;i++) 
for (int k=n—1; k>i;k——) 
if (b[kJ0] < b[k 一 1]D]) 
‘ 
MyMath. swap(b,k,j,k 一 1,j); 
MyMath. swap(c,k,k 一 1); 


分 支 腿 界 法 


} 
for (int i=0;i<n;it++) a[c[iJ[0]=i; 
} 
; 


private static int bound( HeapNode enode, int [] f) 
{ // 计 算 完成 时 间 和 下 界 
for (int k 一 0;k 一 n;jk 十 十 ) 
for (int j 王 03j 一 23 十 十 ) 
y[LkJ[j]=false; 
for (int k=0;k<= enode. s;k 十 十 ) 
for (int j=0;j<25j 二 +) 
y[aLenode. x[k]]D]]D]=truey 


f[1]=enode. {[1]+m[enode. xLenode. s]][0]; 
f[2]=((f[1]>enode. {[2])? f[1]:enode. f[2])+m[enode. x[enode. s]][1]; 
int sf2 一 enode. sf2+f[2]; 
int sl=0,s2=0,kl=n—enode. s,k2 一 n 一 enode. s,f3={f[2]; 
// 计 算 sl 的 值 
for (int j 王 0;j 一 nj;j 十 十 ) 
证 (! yD][o]) { 
一 
if (kl==n—enode. s 一 1) 
{3= ([2]>f[1]+b[JCo])? 拒 2]:f1] 十 b[i][o]; 
sl+=f[1]+kl * bDj][o];}》 
// 计 算 s2 的 值 
for (int j 一 0;j 一 nj;j 十 十 ) 
证 (! yO) { 
k2 一 一 ; 
s1 十 一 b[j][1]， 
s2 十 一 和 十 k2 * b[j][L1];} 
// 返 回 完成 时 间 和 下 界 
return sf2+((sl>s2)? sl:s2); 


} 


算法 bbFlow 是 解 批 处 理 作业 调度 问题 的 优先 队列 式 分 支 限 界 法 的 主体 。 算 法 开始 
时 ,将 排列 树 的 根 结 点 置 为 当前 扩展 结 点 。 在 初始 扩展 结 点 处 还 没有 选 定 的 作业 , 故 ;二 0， 
数组 z 初始 化 为 单位 排列 。 

算法 的 while 循环 完成 对 排列 树 内 部 结 点 的 有 序 扩展 。 在 while 循环 体内 算法 依次 从 
活 结 点 优先 队列 中 取出 具有 最 小 bb 值 的 结 点 作为 当前 扩展 结 点 ,并 加 以 扩展 。 

算法 将 当前 扩展 结 点 enode 分 为 两 种 情形 处 理 。 首 先 考虑 enode. s==n 的 情形 ,此 时 已 
排 定 nn 个 作业 , 故 当 前 扩展 结 点 enode 是 排列 树 中 的 叶 结 点 。enode. x 表示 相应 于 该 叶 结 点 
的 作业 调度 。enode. sf2 是 相应 于 该 叶 结 点 的 完成 时 间 和 。 当 enode. sf2 二 bestc 时 更 新 当前 
最 优 值 bestc 和 相应 的 当前 最 优 解 bestx。 
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当 enode. s 二 n 时 ,算法 依次 产生 当前 扩展 结 点 enode 的 所 有 儿子 结 点 。 对 于 当前 扩展 
结 点 的 每 一 个 儿子 结 点 node, 计 算出 其 相应 的 完成 时 间 和 的 下 界 bb。 当 bb 二 bestc 时 ,将 
该 儿子 结 点 插入 到 活 结 点 优先 队列 中 。 而 当 bb 宇 bestc 时 ,以 node 为 根 的 子 树 中 不 可 能 有 
比 当前 最 优 解 bestx 更 好 的 解 , 故 可 将 结 点 node 全 去。 

解 批 处 理 作业 调度 问题 的 优先 队列 式 分 支 限界 法 可 描述 如 下 : 


public static int bbFlow(int nn) 


{ // 优 先 队列 式 分 支 限界 法 解 批 处 理 作业 调度 问题 


n= 二 nn; 
sort(); ”// 对 各 作业 在 机 器 1 和 2 上 所 需 时 间 排 序 
// 初 始 化 最 小 堆 


MinHeap heap=new MinHeap(); 
HeapNode enode=new HeapNode(n); 
// 搜 索 排 列 空间 树 
do 
{ 
if (enode. s==n ) 
{// 叶 结 点 
if (enode. sf2 一 bestc) 
bestc= enode. sf2; 
for (int i=0; i< n; i 十 十 ) 


bestx[i]=enode. x[i]; 


} 
else // 产 生 当 前 扩展 结 点 的 儿子 结 点 
for (int i=enode. s; i<n; i 十 十 ) 
{ 
MyMath. swap(enode. x, enode. s,i); 
int [] f=new int [3]; 
int bb= bound(enode,f) ; 
if (bb<bestc ) { 
// 子 树 可 能 含 最 优 解 
// 结 点 插 和 人 最 小 堆 
HeapNode node=new HeapNode(enode,f,bb,n); 
heap. put(node) ;} 
MyMath. swap(enode. x, enode. s,D; 
} // 完 成 结 点 扩展 
// 取 下 一 扩展 结 点 
enode= (HeapNode) heap. removeMin(); 
} while (enode ! =null && enode. s<—n ); 


return bestc; 


分 支 腿 界 法 


O) 


小 结 


本 章 介绍 的 分 支 限界 法 类 似 于 回溯 法 ,是 在 问题 的 解 空间 树 上 搜索 问题 解 的 算法 。 分 
支 限 界 法 的 求解 目标 通常 是 找 出 满足 约束 条 件 的 一 个 解 , 或 是 在 满足 约束 条 件 的 解 中 找 出 
使 某 一 目标 函数 值 达到 极 大 或 极 小 的 解 , 即 在 某 种 意义 下 的 最 优 解 。 

本 章 详 细 叙 述 了 队列 式 分 支 限界 法 和 优先 队列 式 分 支 限界 法 的 算法 框架 ,并 用 许多 典 
型 问题 ,如 单 源 最 短路 径 问 题 ,装载 问题 ,布线 问题 .0-1 背包 问题 ,最 大 团 问题 .旅行 售货员 
问题 ,电路 板 排列 问题 ,. 批 处 理 作 业 调度 问题 等 ,从 算法 的 不 同 侧面 阐述 了 应 用 分 支 限界 法 
的 技巧 。 这 些 典 型 问题 大 部 分 已 在 第 5 章 中 出 现 过 。 对 同一 问题 用 两 种 不 同 的 算法 策略 求 
解 更 容易 体会 算法 的 精 散 和 各 自 的 优点 。 


习 题 


6-1 栈 式 分 支 限界 法 将 活 结 点 表 以 后 进 先 出 (LIFO) 的 方式 存储 于 栈 中 。 试 设计 一 个 解 
0-1 背包 问题 的 栈 式 分 支 限界 法 ,并 说 明 栈 式 分 支 限界 法 与 回溯 法 的 区 别 。 

6-2” 试 修改 解 装 载 问题 和 解 0-1 背包 问题 的 优先 队列 式 分 支 限 界 法 ,使 其 仅 使 用 一 个 最 大 
堆 来 存储 活 结 点 ,而 不 必 存 储 所 产生 的 解 空间 树 。 

6-3 解 最 大 团 问 题 的 优先 队列 式 分 支 限界 法 中 ,当前 扩展 结 点 满足 cn 十 n 一 i 三 bestn 的 右 
儿子 结 点 被 插入 到 优先 队列 中 。 如 果 将 这 个 条 件 修 改 为 满足 cn 十 zx 一 ;一 bestn 右 儿 子 
结 点 插 和 人 优先 队列 , 仍 能 保证 算法 的 正确 性 吗 ? 为 什么 ? 

6-4 ”考虑 最 大 团 问题 的 子 集 空间 树 中 第 i 层 结 点 zx, 设 minDegree(z) 是 以 结 点 zx 为 根 的 子 
树 中 所 有 结 点 度数 的 最 小 值 。 

(1) 设 .4 二 min{x. cn 十 n 一 i 十 1,minDegree(z) 十 1) ,证 明 以 结 点 z 为 根 的 子 树 中 任 
一 叶 结 点 所 相应 的 团 的 大 小 不 超过 z.u, 依 此 x.u 的 定义 重 写 算法 bbMaxClique。 
(2) 比较 新 旧 算 法 所 需 的 计算 时 间 和 产生 的 排列 树 结 点 数 。 

6-5” 试 修改 解 旅行 售货员 问题 的 分 支 限 界 法 ,使 得 ;二 n 一 2 的 结 点 不 插入 优先 队列 ,而 是 
将 当前 最 优 排列 存储 于 bestp 中 。 经 这 样 修改 后 ,算法 在 下 一 个 扩展 结 点 满足 条 件 
lcost 三 bestc 时 结束 。 

6-6 ” 试 修改 解 旅行 售货员 问题 的 分 支 限界 法 ,使 得 算法 保存 已 产生 的 排列 树 。 

6-7” 试 设计 解 电路 板 排列 问题 的 队列 式 分 支 限 界 法 ,使 算法 运行 结束 时 输出 最 优 解 和 最 
优 值 。 


和 章 
7 概率 算法 


前 面 各 章 所 讨论 算法 的 每 一 计算 步骤 都 是 确定 的 ,本 章 所 讨论 的 概率 算法 允许 算法 在 
执行 过 程 中 可 随机 地 选择 下 一 个 计算 步骤 。 在 许多 情况 下 , 当 算 法 在 执行 过 程 中 面临 一 个 
选择 时 ,随机 性 选择 常 比 最 优选 择 省 时 。 因 此 ,概率 算法 可 以 在 很 大 程度 上 降低 算法 的 复 
杂 度 。 

概率 算法 的 一 个 基本 特征 是 ,对 所 求解 问题 的 同一 实例 用 同一 概率 算法 求解 两 次 可 能 
得 到 完全 不 同 的 效果 。 这 两 次 求解 所 需 的 时 间 ,甚至 所 得 到 的 结果 可 能 会 有 相当 大 的 差别 。 
概率 算法 可 分 为 4 类 : 数值 概率 算法 、 蒙 特 卡 罗 (Monte Carlo) 算 法 、 拉 斯 维 加 斯 (Las 
Vegas) 算 法 和 售 伍 德 (Sherwood) 算 法 。 

数值 概率 算法 常用 于 数值 问题 的 求解 。 这 类 算法 所 得 到 的 往往 是 近似 解 , 且 近 似 解 的 
精度 随 计算 时 间 的 增加 而 不 断 提高 。 在 许多 情况 下 ,要 计算 出 问题 的 精确 解 是 不 可 能 的 或 
没有 必要 的 ,因此 ,用 数值 概率 算法 可 以 得 到 相当 满意 的 解 。 

蒙特 卡 罗 算 法 用 于 求 问 题 的 准确 解 。 对 于 许多 问题 来 说 ,近似 解 毫 无 意义 。 例 如 ， 
对 于 一 个 判定 问题 其 解 为 是” 或“ 否 ”, 二 者 必 居 其 一 ,不 存在 任何 近似 解答 。 又 如 ,要 求 
一 个 整数 的 因子 时 所 给 出 的 解答 必须 是 准确 的 ,一 个 整数 的 近似 因子 是 没有 任何 意义 
的 。 用 蒙特 卡 罗 算 法 能 求 得 问题 的 一 个 解 , 但 这 个 解 未 必 是 正确 的 。 用 蒙特 卡 罗 算 法 求 
得 正确 解 的 概率 依赖 于 算法 所 用 的 时 间 。 算 法 所 用 的 时 间 越 多 ,得 到 正确 解 的 概率 就 越 
高 。 蒙 特 卡 罗 算 法 的 主要 缺点 也 在 于 此 。 在 一 般 情况 下 ,无 法 有 效 地 判定 所 得 到 的 解 是 
否 肯 定 正确 。 

拉 斯 维 加 斯 算法 不 会 得 到 不 正确 的 解 。 一 旦 用 拉 斯 维 加 斯 算法 找到 一 个 解 , 这 个 解 就 
一 定 是 正确 解 。 但 有 时 用 拉 斯 维 加 斯 算法 找 不 到 解 。 与 蒙特 卡 罗 算 法 类 似 , 拉 斯 维 加 斯 算 
法 找到 正确 解 的 概率 随 着 它 所 用 的 计算 时 间 的 增加 而 提高 。 对 于 所 求解 问题 的 任 一 实例 ， 
用 同一 拉 斯 维 加 斯 算法 反复 对 该 实例 求解 足够 多 次 ,可 使 求解 失败 的 概率 任意 小 。 

舍 伍 德 算法 总 能 求 得 问题 的 一 个 解 , 且 所 求 得 的 解 总 是 正确 的 。 当 一 个 确定 性 算法 在 
最 坏 情况 下 的 计算 复杂 性 与 其 在 平均 情况 下 的 计算 复杂 性 有 较 大 差别 时 ,可 在 这 个 确定 性 
算法 中 引入 随机 性 将 它 改 造成 一 个 舍 伍 德 算法 ,消除 或 减少 问题 的 好 坏 实 例 间 的 这 种 差别 。 
舍 伍 德 算 法 的 精髓 不 是 避免 算法 的 最 坏 情况 行为 ,而 是 设法 消除 这 种 最 坏 情况 行为 与 特定 
实例 之 间 的 关联 性 。 

本 章 的 后 续 各 节 中 将 分 别 讨论 上 述 4 类 概率 算法 。 


在 学 算法 


7.1 随 机 数 


随机 数 在 概率 算法 设计 中 扮演 着 十 分 重要 的 角色 。 在 现实 计算 机 上 无 法 产生 真正 的 随 


机 数 ,因此 ,在 概率 算法 中 使 用 的 随机 数 都 是 在 一 定 程度 上 随机 的 , 即 是 伪 随 机 数 。 


线性 同 余 法 是 产生 伪 随 机 数 的 最 常用 的 方法 。 由 线性 同 余 法 产生 的 随机 序列 wo， 
… sas 满足 


ao=d 
人 一 (al 十 c) mod m 7 一 1,2,… 


其 中 ,5 宇 0,c 宇 0,d 三 m。d 称 为 该 随机 序列 的 种 子 。 如 何 选取 该 方法 中 的 常数 0,c 和 wm ,将 
直接 关系 到 所 产生 的 随机 序列 的 随机 性 能 。 这 是 随机 性 理论 研究 的 内 容 , 已 超出 本 书 讨论 
的 范围 。 从 直观 上 看 ,m 应 取得 充分 大 ,因此 可 取 m 为 机 器 大 数 , 另 外 应 取 gcd(m,5) 二 1, 因 
此 可 取 6 为 一 素数 。 


为 了 在 设计 概率 算法 时 便于 产生 所 需 的 随机 数 ,建立 一 个 随机 数 类 Random。 该 类 包 


含 一 个 需 由 用 户 初始 化 的 种 子 seed。 给 定 初始 种 子 后 , 即 可 产生 与 之 相应 的 随机 序列 。 种 
子 seed 是 一 个 长 整 型 数 ,可 由 用 户 选 定 也 可 用 系统 时 间 自 动产 生 。 方 法 random(n) 返 回 
[0,n 一 1] 范 围 内 的 一 个 随机 整数 。 方 法 {Random() 返 回 [0,1] 内 的 一 个 随机 实数 。 


public class Random 
{ 
private long seed; // 当 前 种 子 
private final static long multiplier=0x5DEECE66DL; 
private final static long adder 一 0xBL; 
private final static long mask= (1L<48)—1; 


// 构 造 方法 ,自动 产生 种 子 
public Random() {this. seed= System. currentTimeMillis() ;} 


// 构 造 方法 ,默认 值 0 表示 由 系统 自动 产生 种 子 

public Random(long seed) 

| 
if (seed==0) this. seed= System. currentTimeMillis() ; 
else this. seed= seed; 


} 


// 产 生 [0,n 一 1] 之 间 的 随机 整数 
public int random(int n) 
{ 
让 Cn< 一 0) 
throw new IllegalArgumentException("n must be positive’); 
seed = (seed x* multiplier 十 adder) & mask; 
return ((int) (seed >>> 17)%n); 
} 
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// 产 生 [0,1] 之 间 的 随机 实数 
public double fRandom() 
{ 
return random(Integer. MAX_VALUE)/(double) (Integer. MAX_VALUE); 
} 
¥ 


算法 random 在 每 次 计算 时 ,用 线性 同 余 式 计算 新 的 种 子 seed。 它 的 高 16 位 的 随机 性 
较 好 。 将 seed 右 移 16 位 得 到 一 个 随机 整数 ,然后 再 将 此 随机 
整数 映射 到 [0,n 一 1 内 。 

算法 {Random 先 用 random 产生 一 个 整 型 随机 序列 ,将 每 
个 整 型 随机 数 映 射 到 [0,1] 中 ,就 得 到 [0,1] 中 的 随机 实数 。 

下 面 用 计算 机 产生 的 伪 随 机 数 来 模拟 抛 硬币 试验 。 假 设 
抛 10 次 硬币 ,每 次 抛 硬币 得 到 正面 和 反面 是 随机 的 。 抛 10 
次 硬币 构成 一 个 事件 。 调 用 random(2) 返 回 一 个 2 值 结 果 。 
返回 0 表示 抛 硬币 得 到 反面 ,返回 1 表示 得 到 正面 。 下面 的 
算法 tossCoins 模拟 抛 10 次 硬币 这 一 事件 。 在 主 方法 中 反复 
用 tossCoins 模拟 抛 10 次 硬币 这 一 事件 50 000 次 ,用 head[ 可 
(其 中 0 过 ;三 10) 记 录 这 50 000 次 模拟 恰好 得 到 i 次 正面 的 次 


数 ,最 终 输出 模拟 抛 硬币 得 到 的 正面 事件 的 频率 图 ,如 图 7-1 图 7-1 模拟 抛 硬币 得 到 的 
所 示 。 正面 事件 的 频率 图 


co on -oo 
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public class Toss 
' 


static Random coinToss; 


public static int tossCoins(int numberCoins) 
{ // 随 机 抛 硬币 
int i, tosses=0; 
for (i=0;i<numberCoins;i++) 
//random(2) 二 1 表示 正面 
tosses 十 一 coinToss. random(2); 
return tosses; 


} 


/*x* 测 试 程序 * / 
public static void main(String [] args) 
{ // 模 拟 随 机 抛 硬币 事件 
coinToss 一 new Random(); 
int ncoins 一 10; 
long ntosses 一 50000L; 
//heads[ 记 是 得 到 i 次 正面 的 次 数 
int 1; 


long [] heads=new long[ncoins+1]; 
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int j, position; 

// 初 始 化 数组 heads 

for (j==0;j 过 ncoins 十 1;j 十 十 》 
heads[j] =0; 

// 重 复 50000 次 模拟 事件 

for (i=0;i<ntosses;it++) 
heads[L tossCoins(ncoins) ] 十 十; 

// 输 出 频率 图 

System. out. println(); 

for (i=0; i 一 一 ncoins;i 十 十 ) 

{ 
position= (int) ( (float)heads[i]/ntosses * 72); 
System. out. print(” 二); 
for (j=0;j < position 一 1;j 十 十 ) 

System. out. print(” ”); 

System. out. println(” * "); 


7.2 数值 概率 算法 


7.2.1 用 随机 投 点 法 计算 增值 


设 有 一 半径 为 7 的 圆 及 其 外 切 四 边 形 , 如 图 7-2(a) 所 示 。 向 该 正方 形 随 机 地 投 毛 个 
点 。 设 落 入 圆 内 的 点 数 为 &。 由 于 所 投入 的 点 在 正 
方形 上 均匀 分 布 ,因而 所 投入 的 点 落 入 圆 内 的 概率 为 


下 二 竺 。 所 以 , 当 刀 足够 大 时 ,与 1 之 比 就 通 近 

这 一 概率 , 即 下 。 从 而 < 人 ~ 伏 。 由 此 可 得 用 随机 投 点 ~、 | 
法 计算 x 值 的 数值 概率 算法 如 下 。 在 具体 实现 时 ,只 

要 在 第 一 象限 计算 ,如 图 7-2(b) 所 示 。 


public static double darts(int n) 
{ // 用 随机 投 点 法 计算 < 值 
int k=0; 
for (int ij 一 1;i< 一 nj;i 十 十 》 
double x= dart. fRandom(); 
double y= dart. {fRandom() ; 
if ((x*xtyx*xy)<=1) k 十 十 ; 
} 
return 4 * k/(double)n; 


(a) (b) 
7-2 计算 x 值 的 随机 投 点 法 
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7.2.2 计算 定 积分 
1. 用 随机 投 点 法 计算 定 积分 
设 f(z) 是 [0,1] 上 的 连续 函数 , 且 0 三 f(x) 二 1。 需要 计算 的 积分 为 1 = [| 积 


分 工 等 于 图 7-3 中 的 面积 G 
在 图 7-3 所 示 单 位 正方 形 内 均 匀 地 做 投 点 试验 , 则 
随机 点 落 在 曲线 y= f(z) 下 面 的 概率 为 


1 [fz) 1 eA) 
ety yey =| j= | j= ， 国 


假设 向 单位 正方 形 内 随机 地 投入 nn 个 点 (zi,yi) ,i 二 6 
。 随 机 点 (zi,yi) 落 入 G 内 , 则 yy; 三 f(x;)。 如 果 


有 了 个 点 落 入 G 内 , 则 了 二 至 近似 等 于 随机 点 落 信 G 内 


0 1 
Tt 


图 7-3 计算 定 积分 的 随机 投 点 法 
的 概率 , 即 [一 全。 
由 此 可 设计 出 计算 积分 工 的 数值 概率 算法 。 


public static double dartsl (int n) 
{ 。 // 用 随机 投 点 法 计算 定 积分 
int k=0; 
for (int i=1;i<=n;i++) { 
double x= dart. fRandom(); 
double y= dart. f{fRandom() ; 
if (y<={(x)) k++ ; 
} 
return k/(double)n; 
} 


如 果 所 过 到 的 积分 形式 为 I= [fear ,其 中 a 和 wb 为 有 限 值 ;被 积 函 数 f(z) 在 区 间 


[a,6] 中 有 界 , 并 用 M,L 分 别 表示 其 最 大 值 和 最 小 值 。 此 时 可 进行 变量 代 换 z==a 十 (6 一 a)x， 
将 所 求 积 分 变 为 =cI* 十 4d。 其 中 ， 


1 
c (M—L)(b—a), d=L(6—a), I* [We 
0 


天 二 [Fe+G qa)z) 一 Lj], 且 有 0 三 f* (xz) 二 1。 因此 ,1* 可 用 随机 投 点 法 计算 。 


2. 用 平均 值 法 计算 定 积分 
任 取 一 组 相互 独立 、 同 分 布 的 随机 变量 {5},& 在 La,6j] 中 服从 分 布 律 f(x), 令 


5 CD 一 上 全 , 则 1 g* (&)) 也 是 一 组 互 独立 、 同 分 布 的 随机 变量 ,而 且 


El(g* (§)) = 全 (xz)f(xz)dr = [ga = 
由 强大 数 定理 


厦 学 算法 


第 

P,(limi eC =1)=1 
We i=1 

章 


车 选 了 = 二 了 gC&) , 则 了 了 依 概率 1 收敛 于 1。 平均 值 法 就 是 用 了 作为 1 的 近似 值 。 


假设 要 计算 的 积分 形式 为 1 二 g(x)dz ,其 中 被 积 丙 数 g(x) 在 区 间 [a, 人 内 可 积 。 


任意 选择 一 个 有 简便 方法 可 以 进行 抽样 的 概率 密度 函数 f(x) ,使 其 满足 下 列 条 件 : 
(1) F(z) 天 0, 当 gCz) 天 0 时 (其 中 oz 委 0) 。 


b 
2) [fra =1。 


如 果 记 
g(x) . 
“w= ee 
0 f(z)=0 
则 所 求 积 分 可 以 写 为 


rb 
了 一 | gg”(z)FCzr)dz 


由 于 a 和 4b 为 有 限 值 ,可 取 f(x) 为 均匀 分 布 , 即 
1 


站 
0- [Te 
0 二 交 
这 时 所 求 积 分 变 为 
b 
= yl 
了 一 (0 of ge 


在 [a 站 中 随机 抽取 个 点 (其 中 ;二 1,2,…, 加 ), 则 均值 了 一 二》 gC) 可 作为 所 


n 
求 积分 了 的 近似 值 。 
由 此 可 设计 出 计算 积分 工 的 平均 值 法 如 下 : 


public static double integration(double a, double b, int n) 
{ // 用 平均 值 法 计算 定 积分 
Random rnd=new Random(); 
double y=0; 
for (int i=1;i<=n;i++) 
{ 
double x 一 (b 一 a) * rnd.fRandom() 十 a; 
y+={(x); 
} 
return (b 一 a) * y/(double)n; 
} 


7.2.3 解 非 线性 方程 组 
假设 要 求解 下 面 的 非 线性 方程 组 
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万 (zivzz…ze) 一 0 


JFCziyzz，…Tno) 一 0 


广 (Cziyzz……yZn) 一 0 

其 中 ,zi ,xs，… ,zs 是 实 变量 ,fi(i 二 1,2,…,n) 是 未 知 量 zi ,zxs，… ,x 的 非 线性 实 函 数 。 要 
求 确定 上 述 方程 组 在 指定 求 根 范围 内 的 一 组 解 xz? ,zx? ，… ,zx?。 

解决 这 类 问题 有 许多 种 数值 方法 。 最 常用 的 有 线性 化 方法 和 求 函数 极 小 值 方法 。 应 当 
指出 ,在 使 用 某 种 具体 算法 求解 的 过 程 中 ,有 时 会 遇 到 一 些 麻烦 ,甚至 于 使 方法 失效 而 不 能 
获得 一 个 近似 解 。 在 这 种 情况 下 ,可 以 求助 于 概率 算法 。 一 般 而 言 , 尽 管 概率 算法 需 耗 费 较 
多 时 间 ,但 其 设计 思想 简单 ,易于 实现 ,因此 在 实际 使 用 中 还 是 比较 有 效 的 。 对 于 精度 要 求 
较 高 的 问题 ,概率 算法 常常 可 以 提供 一 个 较 好 的 初 值 。 下 面 介绍 求解 非 线 性 方程 组 的 概率 
算法 的 基本 思想 。 

为 了 求解 所 给 的 非 线 性 方程 组 ,构造 一 函数 


a 


Bz) = Df iz) 
其 中 ,x 二 (zi ,zo，……,X,)。 易 知 ,该 函数 B(x) 的 零点 即 是 所 求 非 线 性 方程 组 的 一 组 解 。 

在 求 函 数 B(x)==0 的 解 时 可 采用 简单 随机 模拟 算法 。 在 指定 求 根 区 域内 , 选 定 一 个 xz。 
作为 根 的 初 值 。 按 照 预先 选 定 的 分 布 ( 如 以 ze 为 中 心 的 正 态 分 布 .均匀 分 布 .三 角 分 布 等 )， 
逐个 选取 随机 点 zx。 计算 目标 函数 @(z) ,并 把 满足 精度 要 求 的 随机 点 z 作为 所 求 非 线性 方 
程 组 的 近似 解 。 用 这 种 方法 求 根 ,方法 直观 ,算法 简单 ,但 工作 量 较 大 。 为 了 克服 这 一 缺点 ， 
下 面 介 绍 一 个 随机 搜索 算法 。 

在 指定 求 根 区 域 D 内 , 选 定 一 个 随机 点 ze 作为 随机 搜索 的 出 发 点 。 在 算法 的 搜索 过 
程 中 ,假设 第 7) 步 随机 搜索 得 到 的 随机 搜索 点 为 zj 。 在 第 j 十 1 步 ,首先 计算 出 下 一 步 的 随 
机 搜索 方向 ~, 然后 计算 搜索 步 长 a, 由 此 得 到 第 j 十 1 步 的 随机 搜索 增 量 Az 。 从 当前 点 zx， 
依 随机 搜索 增 量 Azi 得 到 第 j 十 1 步 的 随机 搜索 点 zj+1 二 zj 十 Axz;。 当 B(zj+1) 过 e 时 , 取 
Zzjt1 为 所 求 非 线性 方程 组 的 近似 解 ,否则 进行 下 一 步 新 的 随机 搜索 过 程 。 

具体 算法 描述 如 下 : 


public static boolean nonLinear(double [] x0, double [] dx0, double [] x, double a0， 
double epsilon, double k, int n, int steps, int m) 
{ // 解 非 线性 方程 组 的 概率 算法 


Random rnd 一 new Random(); 


boolean success; // 搜 索 成 功 标志 
double [Jdx=new double [n 十 1]; // 步 进 增 量 向 量 
double [Jr=new double [n 十 1]; // 搜 索 方向 向 量 
int mm 一 0; // 当 前 搜索 失败 次 数 
int j=0; // 和 迭代 次 数 
double a 一 a0; // 步 长 因子 
for (int i 一 1;i< 一 nji 十 十 ) { 

x[i]=x0[i]; 


dx[i]= dx0[i]; 


} 
double fx={(x,n); // 计 算 目标 函数 值 
double min 一 fx; // 当 前 最 优 值 
while ((min>epsilon) && (j=<steps)) { 
j 十 十 ; 
//(GD) 计 算 随 机 搜索 步 长 
让 (fx 二 min) { // 搜 索 成 功 
min=fx; 
ax 一 ks 
success=true;} 
else { // 搜 索 失 败 
mm 十 十 ; 
让 (mm>m) a/=k; 
success= false;)} 
//(2) 计 算 随 机 搜索 方向 和 增 量 
for (int i 一 1;i< 一 nji 十 十 ) 
r[i]=2.0* rnd. fRandom() 一 1; 
if (success) 
for (int i=1;i<=n;i++) 
dx[i]=a* 7[i]; 
else 
for (int i=1;i<=n;i++) 
dx[i]=a* r[]—dx[i]; 
//(3) 计 算 随机 搜索 点 
for (int ji 一 1;i< 一 nji 十 十 ) 
x[ 口 十 一 dx[ 襄 ; 
//(4) 计 算 目 标 函 数值 
fx={(x,n); 
} 
if (fx< 一 epsilon) return true; 


else return false; 


7.3 ”全 伍德 算法 


atm Daz)/ .| 


zEX, 
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分 析 算 法 在 平均 情况 下 的 计算 复杂 性 时 ,通常 假定 算法 的 输入 数据 服从 某 一 特定 的 概 
率 分 布 。 例 如 ,在 输入 数据 是 均匀 分 布 时 ,快速 排序 算法 所 需 的 平均 时 间 是 O(nlogn) 。 而 当 
其 输入 已 “几乎 ” 排 好 序 时 ,这 个 时 间 界 就 不 再 成 立 。 在 这 种 情况 下 ,通常 可 采用 舍 伍 德 算法 
来 消除 算法 所 需 计 算 时 间 与 输入 实例 间 的 这 种 联系 。 
设 A 是 一 个 确定 性 算法 , 当 它 的 输入 实例 为 zx 时 所 需 的 计算 时 间 记 为 zaCz)。 设 X, 是 
算法 A 的 输入 规模 为 n 的 实例 的 全 体 , 则 当 问 题 的 输入 规模 为 n 时 ,算法 A 所 需 的 平均 时 
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这 显然 不 能 排除 存在 zxE X, 使 得 ta (x) ta (n) 的 可 能 性 。 希 望 获得 一 个 概率 算法 也 ,使 得 

对 问题 的 输入 规模 为 n 的 每 一 个 实例 xEX, 均 有 ts(zx) 二 ta (nn) 十 s(n)。 对 于 某 一 具体 实 

例 zEX,, 算 法 B 偶尔 需要 比 t4 Cn) 十 s(n) 多 的 计算 时 间 。 但 这 仅仅 是 由 于 算法 所 做 的 概 

率 选择 引起 的 ,与 具体 实例 zx 无关 。 定 义 算法 B 关 于 规模 为 n 的 随机 实例 的 平均 时 间 为 
ta(n) = > zaCz)/ | X, | 


EX 


易 知 ,ts(n) 二 ta (n) 十 s(n)。 这 就 是 舍 伍 德 算法 设计 的 基本 思想 。 当 s(n) 与 a(n) 相 比 
可 忽略 时 , 舍 伍 德 算法 可 获得 很 好 的 平均 性 能 。 


7.3.1 线性 时 间 选 择 算 法 


在 第 2 章 中 讨论 了 快速 排序 算法 和 线性 时 间 选 择 算法 。 这 两 个 算法 的 随机 化 版 本 就 是 
合 伍 德 型 概率 算法 。 这 两 个 算法 的 核心 都 在 于 选择 合适 的 划分 基准 。 对 于 选择 问题 而 言 ， 
用 拟 中 位 数 作为 划分 基准 可 以 保证 在 最 坏 情况 下 用 线性 时 间 完 成 选择 。 如 果 只 简单 地 用 待 
划分 数组 的 第 一 个 元 素 作为 划分 基准 , 则 算法 的 平均 性 能 较 好 ,而 在 最 坏 情况 下 需要 O(n?) 
计算 时 间 。 侈 伍德 型 选择 算法 则 随机 地 选择 一 个 数组 元 素 作 为 划分 基准 。 这 样 既 能 保证 算 
法 的 线性 时 间 平 均 性 能 又 避免 了 计算 拟 中 位 数 的 麻烦 。 

非 递归 的 舍 伍 德 型 选择 算法 可 描述 如 下 : 


public static Comparable select(Comparable [] a, int k) 
{ 
if (k<1 || k>a. length) 
throw new IllegalArgumentException ("k must be between 1 and a. length’); 
// 将 最 大 元 移 至 右 端 
MyMath. swap(a, a. length—1, MyMath. max(a, a. length—1)); 
int |=0; 
int r=a. length—1; 
rnd 一 new Random(); 
while (true) 
if (>=7) return a[l]; 
int i 一 1， 
j=1 十 rnd. random(r 一 D; // 随 机 选择 的 划分 基准 
MyMath. swap(ayi',j); 
j=r+1; 
Comparable pivot=a[l]; 
// 以 划分 基准 为 轴 作 元 素 交 换 
while (true) 
{ 
while (a[++i]. compareTo( pivot)=0); 
while (a[ ——j]. compareTo(pivot)>0); 
让 (i>=)) break; 
MyMath. swap(a, i, j); 
} 
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让 (—l+1==k) return pivot; 
a[D 一 a[i]; 7 
a[j]= pivot; 章 
// 对 子 数组 重复 划分 过 程 
让 G—l+1<k) { 

k 一 k 一 j 十 ] 一 1; 

l=j+1;} 


else r=j—1; 


} 


由 于 算法 select 使 用 随机 数 产 生 器 随机 地 产生 1 和 7 之 间 的 随机 整数 。 因 此 ,算法 
select 所 产生 的 划分 基准 是 随机 的 。 在 这 个 条 件 下 ,可 以 证 明 , 当 用 算法 select 对 含有 个 
元 素 的 数组 进行 划分 时 ,划分 出 的 低 区 子 数 组 中 含有 1 个 元 素 的 概率 为 2/n; 含 有 i 个 元 素 
的 概率 为 1/n,i 二 2,3,…,n 一 1。 设 T(n) 是 算法 select 作用 于 一 个 含 及 个 元 素 的 输入 数 
组 上 所 需 的 期 望 时 间 的 一 个 上 界 , 且 T(n) 是 单调 递增 的 。 在 最 坏 情况 下 ,第 小 元 素 总 是 
被 划分 在 较 大 的 子 数组 中 。 由 此 ,可 以 得 到 关于 T(x) 的 递归 式 

T()< TL (Tomax(1,n— 有 六 十 2 TomaxGisn—i)))+ Ow) 


n 


这 1 


rl 
< 二 (TO 一 D+22TG))+OCOD 


i=n/2 


nl 
= 多 T+4On) 


i=m/2 
上 面 的 推导 中 ,从 第 一 行 到 第 二 行 是 因为 max(1,n 一 1) 二 n 一 1, 而 
i i 宇 n/2 
n—i i=n/2 
并 且 当 是 奇数 时 ,T(x/2) ,TCn/2 十 1),… ,Tn 一 1) 在 和 式 中 均 出 现 2 次 ; 当 n 是 偶数 时 ， 
Tn/2 十 1) ,TCn/2 十 2),…,T(n 一 1) 均 出 现 2 次 ,T(n/2) 只 出 现 1 次 。 因 此 ,第 二 行 中 的 和 
式 是 第 一 行 中 和 式 的 一 个 上 界 。 从 第 二 行 到 第 三 行 是 因为 在 最 坏 情 况 下 Tn 一 1) 二 O(n?)， 


故 可 将 汪 T(n 一 1) 包 含 在 OG) 项 中 。 


解 上 面 的 递归 式 可 得 T(x) 二 O(n)。 换 名 话说 , 非 递 归 的 使 伍德 型 选择 算法 select 可 以 
在 O(n) 平均 时 间 内 找 出 个 输入 元 素 中 的 第 & 小 元 素 。 

综 上 所 述 ,开始 时 所 考虑 的 是 一 个 有 很 好 平均 性 能 的 选择 算法 ,但 在 最 坏 情况 下 对 某 些 
实例 算法 效率 较 低 。 在 这 种 情况 下 ,采用 概率 方法 ,将 上 述 算法 改造 成 一 个 舍 伍 德 型 算法 ， 
使 得 该 算法 以 高 概率 对 任何 实例 均 有 效 。 

对 于 舍 伍 德 型 快速 排序 算法 ,分析 是 类 似 的 。 

上 述 合 伍 德 型 选择 算法 对 确定 性 选择 算法 所 做 的 修改 是 非常 简单 而 容易 实现 的 。 但 有 
时 也 会 遇 到 这 样 的 情况 , 即 所 给 的 确定 性 算法 无 法 直接 改造 成 舍 伍 德 型 算法 。 此 时 可 以 借 
助 随机 预 处 理 技术 ,不 改变 原 有 的 确定 性 算法 , 仅 对 其 输入 进行 随机 洗 牌 ,同样 可 以 收 到 售 
伍德 算法 的 效果 。 例 如 ,对 于 确定 性 选择 算法 :可 以 用 下 面 的 洗 牌 算法 shuffle 将 数组 a 中 


max(i,n—i) 一 
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元 素 随机 排列 ,然后 用 确定 性 选择 算法 求解 。 这 样 做 所 收 到 的 效果 与 舍 伍 德 型 算法 的 效果 
是 一 样 的 。 
public static void shuffle(Comparable [ Ja, int n) 
{// 随 机 洗 牌 算法 
rnd 一 new Random(); 
for (int i=0;i<n;it++) 
{ 
int j=rnd. random(n—i) +i; 
MyMath. swap(a, i, j); 
} 
} 


7.3.2 跳跃 表 


舍 伍 德 型 算法 的 设计 思想 还 可 用 于 设计 高 效 的 数据 结构 ,跳跃 表 就 是 一 个 例子 。 如 果 
用 有 序 链表 来 表示 一 个 含有 个 元 素 的 有 序 集 S, 则 在 最 坏 情况 下 ,搜索 S 中 一 个 元 素 需 要 
Q(n) 计 算 时 间 。 提 高 有 序 链表 效率 的 一 个 技巧 是 在 有 序 链表 的 部 分 结 点 处 增设 附加 指针 
以 提高 其 搜索 性 能 。 在 增设 附加 指针 的 有 序 链 表 中 搜索 一 个 元 素 时 ,可 借助 于 附加 指针 跳 
过 链表 中 若干 结 点 ,加 快 搜索 速度 。 这 种 增加 了 向 前 附加 指针 的 有 序 链表 称 为 跳跃 表 。 应 
在 跳跃 表 的 哪些 结 点 增加 附加 指针 以 及 在 该 结 点 处 应 增加 多 少 指针 ,完全 采用 随机 化 方法 
来 确定 。 这 使 得 跳跃 表 可 在 O(log nw') 平 均 时 间 内 支持 关于 有 序 集 的 搜索 、 插 入 和 删除 等 运 
算 。 例 如 ,图 7-4(a) 是 一 个 没有 附加 指针 的 有 序 链表 ,而 图 7-4(b) 在 图 7-4(a) 的 基础 上 增 
加 了 跳跃 一 个 结 点 的 附加 指针 ,图 7-4(c) 在 图 7-4(b) 的 基础 上 又 增加 了 跳跃 3 个 结 点 的 附 
加 指针 。 
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图 7-4 完全 跳跃 表 


bo 


在 跳跃 表 中 ,如 果 一 个 结 点 有 十 1 个 指针 , 则 称 此 结 点 为 一 个 级 结 点 。 

以 图 7-4(c) 中 跳跃 表 为 例 ,来 看 如 何在 该 跳跃 表 中 搜索 元 素 8。 从 该 跳跃 表 的 最 高 级 ， 
即 第 2 级 开始 搜索 。 利 用 2 级 指针 发 现 元 素 8 位 于 结 点 7 和 19 之 间 。 此 时 在 结 点 7 处 降 
至 1 级 指针 继续 搜索 ,发 现 元 素 8 位 于 结 点 7 和 13 之 间 。 最 后 ,在 结 点 7 处 降 至 0 级 指针 
进行 搜索 ,发 现 元 素 8 位 于 结 点 7 和 11 之 间 , 从 而 知道 元 素 8 不 在 所 搜索 的 集合 S 中 。 
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在 一 般 情况 下 ,给 定 一 个 含有 个 元 素 的 有 序 链 表 , 可 以 将 它 改造 成 一 个 完全 跳跃 表 ， 
使 得 每 一 个 级 结 点 含有 k 十 1 个 指针 ,分 别 跳 过 2 一 1,2 和 :一 1,…,2" 一 1 个 中 间 结 点 。 第 
i 个 级 结 点 安排 在 跳跃 表 的 位 置 i? 处 ,i 汪 0。 这 样 就 可 以 在 O(log nn) 时 间 内 完成 集合 成 
员 的 搜索 运算 。 在 一 个 完全 跳跃 表 中 ,最 高 级 的 结 点 是 [log n 卢 结 点 。 

完全 跳跃 表 与 完全 二 又 搜索 树 的 情形 非常 类 似 。 它 虽然 可 以 有 效 地 支持 成 员 搜 索 运 
算 , 但 不 适应 于 集合 动态 变化 的 情况 。 集 合 元 素 的 插入 和 删除 运算 会 破坏 完全 跳跃 表 原 有 
的 平衡 状态 ,影响 后 继 元 素 搜索 的 效率 。 

为 了 在 动态 变化 中 维持 跳跃 表 中 附加 指针 的 平衡 性 ,必须 使 跳跃 表 中 级 结 点 数 维 
持 在 总 结 点 数 的 一 定 比 例 范围 内 。 注 意 到 在 一 个 完全 跳跃 表 中 ,50% 的 指针 是 0 级 指 


针 ;25% 的 指针 是 1 级 指针 ;……;(100/2 人 1)% 的 指针 是 级 指针 。 因 此 ,在 插入 一 个 元 
素 时 ,以 概率 1/2 引入 一 个 0 级 结 点 ,以 概率 1/4 引入 一 个 1 级 结 点 ,…… ,以 概率 1/2**? 


引入 一 个 级 结 点 。 另 外 ,一 个 i 级 结 点 指向 下 一 个 同 级 或 更 高 级 的 结 点 , 它 所 跳 过 的 结 
点 数 不 再 准确 地 维持 在 2 一 1。 经 过 这 样 的 修改 ,就 可 以 在 插入 或 删除 一 个 元 素 时 ,通过 
对 跳跃 表 的 局 部 修改 来 维持 其 平衡 性 。 跳 跃 表 中 结 点 的 级 别 在 插入 时 确定 ,一 旦 确定 便 
不 再 更 改 。 图 7-5 是 遵循 上 述 原则 的 跳跃 表 的 例子 。 对 其 进行 搜索 与 对 完全 跳跃 表 所 作 
的 搜索 是 一 样 的 。 
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图 7-5 跳跃 表示 例 


如 果 和 希望 在 图 7-5 所 示 的 跳跃 表 中 插入 一 个 元 素 8, 则 先 在 跳跃 表 中 搜索 其 插入 位置 。 
经 搜索 发 现 应 在 结 点 7 和 11 之 间 插 入 元 素 8。 此 时 在 结 点 7 和 11 之 间 增 加 1 个 存储 元 素 
8 的 新 结 点 ,并 以 随机 的 方式 确定 新 结 点 的 级 别 。 例 如 ,如 果 元 素 8 是 作为 一 个 2 级 结 点 捅 
入 , 则 应 对 图 7-5 中 与 虚线 相交 的 指针 进行 调整 ,如 图 7-6(a) 所 示 。 如 果 新 插入 的 结 点 是 一 
个 1 级 结 点 , 则 只 要 修改 2 个 指针 ,如 图 7-6(b) 所 示 。 图 7-5 中 与 虚线 相交 的 指针 是 在 插入 
新 结 点 后 有 可 能 被 修改 的 指针 ,这 些 指针 可 在 搜索 元 素 插入 位 置 时 动态 地 保存 起 来 ,以 供 实 
施 插 入 时 使 用 。 


三 


| 

中 1 
加 
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图 7-6 在 跳跃 表 中 插入 新 结 点 


在 上 述 算法 中 ,一 个 关键 的 问题 是 如 何 随 机 地 生成 新 插入 结 点 的 级 别 。 注 意 到 ,在 一 个 
完全 跳跃 表 中 ,具有 i 级 指针 的 结 点 中 有 一 半 同 时 具有 i 十 1 级 指针 。 为 了 维持 跳跃 表 的 平 
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衡 性 ,可 以 事先 确定 一 个 实数 0p 二 1, 并 要 求 在 跳跃 表 中 维持 在 具有 i 级 指针 的 结 点 中 同 
时 具有 i 十 1 级 指针 的 结 点 所 占 比 例 约 为 p。 为 此 目的 ,在 插入 一 个 新 结 点 时 , 先 将 其 结 点 
级 别 初始 化 为 0, 然后 用 随机 数 生成 器 反复 地 产生 一 个 [0,1j 的 随机 实数 g。 如 果 g 二 p, 则 
使 新 结 点 级 别 增加 1, 直至 g 宇 p。 由 此 产生 新 结 点 级 别 的 过 程 可 知 ,所 产生 的 新 结 点 的 级 别 
为 0 的 概率 为 1 一 p, 级 别 为 1 的 概率 为 p(1 一 p),…… ,级别 为 i 的 概率 为 p'(1 一 p)。 如 此 
产生 的 新 结 点 的 级 别 有 可 能 是 一 个 很 大 的 数 , 甚 至 远 远 超 过 表 中 元 素 的 个 数 。 为 了 避免 这 
种 情况 ,用 logysn 作为 新 结 点 级 别 的 上 界 ,其 中 是 当前 跳跃 表 中 结 点 个 数 。 当 前 跳跃 表 
中 任 一 结 点 的 级 别 不 超过 logysn。 在 具体 实现 时 ,可 以 用 一 个 预先 确定 的 常数 maxLevel 
来 作为 跳跃 表 结 点 级 别 的 上 界 。 

下 面 讨论 跳跃 表 的 实现 细节 。 跳 跃 表 结 点 类 型 由 类 SkipNode 定义 如 下 : 

protected static class SkipNode 

{ 

protected Comparable key; 


protected Object element; 
protected SkipNode [] next; // 指 针 数 组 


// 构 造 方法 
protected SkipNode(Object k, Object e, int size) 
{ 
key= (Comparable)k; 
element=e; 
next 一 new SkipNode [size]; 
} 
. 


其 中 ,element 域 存放 集合 中 元 素 ,next 是 该 结 点 的 指针 数组 ,next[ 门 是 它 的 第 i 级 指针 。 
跳跃 表 由 类 SkipList 定义 如 下 : 


public class SkipList 
{ 


protected float prob; // 用 于 分 配 结 点 级 别 
protected int maxLevel; // 跳 跃 表 级 别 上 界 
protected int levels; // 当 前 最 大 级 别 
protected int size; // 当 前 元 素 个 数 
protected Comparable tailKey; // 元 素 键 值 上 界 
protected SkipNode head; // 头 结 点 指针 
protected SkipNode tail; // 尾 结 点 指针 
protected SkipNode [] last; // 指 针 数 组 
protected Random r; // 随 机 数 产 生 器 

// 构 造 方法 


public SkipList(Comparable large, int maxE, float p) 
. 
prob=p; 


在 学 算法 


// 初 始 化 跳跃 表 级 别 上 界 第 
maxLevel= (int) Math. round(Math. log(maxE) / Math. log(1/prob))—1; 7 
tailKey= large; 章 


// 创 建 头 ` 尾 结 点 和 数组 last 
head 一 new SkipNode (null，null，maxLevel 十 1); 
tail 一 new SkipNode (tailKey, null, 0); 
last=new SkipNode [maxLevel 十 1]; 
// 将 跳跃 表 初 始 化 为 空 表 
for (int i=0; i< 一 maxLevel; i 十 十 ) 
head. next[i]= tail; 
r 一 new Random(); // 初 始 化 随机 数 产 生 器 
} 
} 


跳跃 表 中 0 级 链 元 素 从 小 到 大 排列 。 跳 跃 表 的 构造 方法 初始 化 跳跃 表 的 一 些 参 数值 ， 
如 prob,levels,maxLevel,tailKey 等 。 
当 需 要 搜索 集合 中 键 值 为 & 的 元 素 时 ,可 用 算法 search 来 搜索 。 当 算法 search 搜索 到 
键 值 为 & 的 元 素 时 ,将 该 元 素 返 回 到 e 中 ,并 返回 true; 否则 ,返回 false。 算 法 search 从 最 
高 级 指针 链 开始 搜索 ,一 直到 0 级 指针 链 。 在 每 一 级 搜索 中 尽 可 能 地 接近 要 搜索 的 元 素 。 
当 算 法 从 for 循环 退出 时 ,正好 处 在 和 欲 寻找 元 素 的 左边 。 与 0 级 指针 所 指 的 下 一 个 元 素 进 
行 比较 , 即 可 确定 要 找 的 元 素 是 否 在 跳跃 表 中 。 
SkipNode search(Object k) 
{// 搜 索 指定 元 素 k 
SkipNode p= head; 
for (int i=levels; i>=0; i——) 
{ 
while (p. next[ij. key. compareTo(k) 一 0) // 在 第 i 级 链 中 搜索 
p=p. next[i]; 
last[ 训 =p; // 上 一 个 第 i 级 结 点 
} 


return (p. next[0]); 


上}: 


在 跳跃 表 中 插入 一 个 元 素 的 算法 可 描述 如 下 。 在 插入 一 个 新 结 点 时 ,算法 随机 地 为 其 分 
配 一 个 结 点 级 别 。 当 要 插入 的 元 素 键 值 超 界 时 ,方法 put 将 引发 IllegalArgumentException 异 
常 。 当 元 素 e 成 功 插入 后 ,put 返回 跳跃 表 。 
int level() 
{// 产 生 不 超过 MaxLevel 的 随机 级 别 
int lev=0; 
while (r. {Random()<= prob) 
lev 十 十 ; 


return (lev< 一 maxLevel) ? lev : maxLevel; 
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public Object put(Object k, Object e) 
{// 插 和 指定 元 素 e 


从 跳跃 表 中 删除 一 个 元 素 的 算法 可 描述 如 下 。 该 算法 用 来 删除 跳跃 表 中 键 值 为 的 元 
素 , 并 将 所 删除 的 元 素 存放 在 e 中 。 在 算法 的 执行 过 程 中 , 若 没有 找到 键 值 为 & 的 元 素 , 则 
返回 null。 算 法 中 的 while 循环 用 来 修改 levels 的 值 , 找 出 至 少 包 含 一 个 元 素 的 指针 级 别 。 


让 (tailKey. compareTo(k)< 一 0) // 元 素 键 值 超 界 
throw new IllegalArgumentException("key is too large"); 


// 检 查 元 素 是 否 已 存在 
SkipNode p= search(k); 
if (p. key. equals(k)) 
{// 元 素 已 存在 
Object ee 一 p. element; 
Pp. element=e; 


return ee; 


// 元 素 不 存在 ,确定 新 结 点 级 别 
int lev 一 level(); 
// 调 整 各 级 别 指针 
if (lev> levels) 
‘ 
lev= 十 十 levels; 
last[lev]= head; 
} 


// 产 生 新 结 点 ,并 将 新 结 点 插入 p 之 后 
SkipNode y= new SkipNode (k, e, lev+1); 
for (int i=0; i<=lev; i 十 十 ) 
{// 插 入 第 i 级 链 

y. next[i]=1ast[i]. next[i]; 

last[i]. next[i]=y; 
size 十 十 ; 


return null; 


当 跳 跃 表 为 空 时 ,levels 被 置 为 0。 


public Object remove(Object k) 


{ 


让 (tailKey. compareTo(k)< 一 0) // 元 素 键 值 超 界 


return null; 


// 搜 索 待 删除 元 素 
SkipNode p= search(k); 


在 学 算法 


让 (1p. key. equals(k)) // 未 找到 


return null; 


// 从 跳跃 表 中 删除 结 点 
for (int i=0; i<— levels && last[i]. next[i]==p; i 十 十 ) 
last[i]. next[i]=p. next[i]; 


// 更 新 当前 级 别 
while (levels>0 &&. head. next[levels]==tail) levels 一 一 ; 


He——} 
return p. element; 


} 


当 跳 跃 表 中 有 个 元 素 时 ,在 最 坏 情况 下 ,对 跳跃 表 进 行 搜索 ,插入 和 删除 运算 所 需 的 
计算 时 间 均 为 O(n 十 maxLevel)。 在 最 坏 情况 下 ,可 能 只 有 1 个 maxLevel 级 的 元 素 , 其 余 
元 素 均 在 0 级 链 上 。 此 时 跳跃 表 退 化 为 有 序 链 表 。 由 于 跳跃 表 采 用 了 随机 化 技术 , 它 的 每 
一 种 运算 (搜索 ,插入 和 删除 ) 在 最 坏 情况 下 的 期 望 时 间 均 为 O(log n)。 

在 一 般 情况 下 ,跳跃 表 的 1 级 链 上 大 约 有 nXp 个 元 素 ,2 级 链 上 大 约 有 nxXp? 个 元 素 ,…… 5 
i 级 链 上 大 约 有 nX p' 个 元 素 。 因 此 ,跳跃 表 指 针 域 占用 空间 的 平均 值 是 n>》)p’ = n/(1 一 


p) 。 即 跳跃 表 所 占用 的 空间 为 O(n)。 特 别 地 , 当 p= 二 0.5 时 , 约 需 2n 个 指针 空间 。 


7.4 拉 斯 维 加 斯 算法 


舍 伍 德 算法 的 优点 是 其 计算 时 间 复 杂 性 对 所 有 实例 而 言 相 对 均匀 ,但 与 其 相应 的 确定 
性 算法 相 比 ,其 平均 时 间 复 杂 性 没有 改进 。 拉 斯 维 加 斯 ( Las Vegas ) 算 法 则 不 然 , 它 能 显著 
地 改进 算法 的 有 效 性 ,甚至 对 某 些 迄今 为 止 找 不 到 有 效 算 法 的 问题 ,也 能 得 到 满意 的 算法 。 

拉 斯 维 加 斯 算法 的 一 个 显著 特征 是 它 所 做 的 随机 性 决策 有 可 能 导致 算法 找 不 到 所 需 的 
解 。 因 此 ,通常 用 一 个 boolean 型 方法 表示 拉 斯 维 加 斯 算法 。 当 算法 找到 一 个 解 时 ,返回 
true; 和 否则 ,返回 false。 拉 斯 维 加 斯 算法 的 典型 调用 形式 为 boolean success 王 LVCz,y) ,其 
中 并 是 输入 参数 。 当 success 的 值 为 true 时 ,y 返回 问题 的 解 ; 当 success 为 false 时 ,算法 
未 能 找到 问题 的 一 个 解 。 此 时 ,可 对 同一 实例 再 次 独立 地 调用 相同 的 算法 。 

设 p(z) 是 对 输入 并 调用 拉 斯 维 加 斯 算法 获得 问题 的 一 个 解 的 概率 ,一 个 正确 的 拉 斯 维 
加 斯 算法 应 该 对 所 有 输入 工 均 有 zj(z) 二 0。 在 更 强 的 意义 下 ,要求 存在 一 个 常数 9 二 0 ,使 
得 对 问题 的 每 一 个 实例 z 均 有 p(z) 宇 6。 设 s(z) 和 el(z) 分 别 是 算法 对 于 具体 实例 求解 
成 功 或 求解 失败 所 需 的 平均 时 间 , 考 虑 下 面 的 算法 。 

public static void obstinate(Object x, Object y) 

{// 反 复 调用 拉 斯 维 加 斯 算法 LV(x,y) ,直到 找到 问题 的 一 个 解 y 

boolean success=false; 


while (! success) success=lv(x,y); 


~ 
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由 于 训 (z) 二 0, 故 只 要 有 足够 的 时 间 ,对 任何 实例 zx, 上 述 算法 obstinate 总 能 找到 问题 
的 一 个 解 。 设 5(z) 是 算法 obstinate 找到 具体 实例 z 的 一 个 解 所 需 的 平均 时 间 , 则 有 
tr) = pl(z)s(z) (1— pr)) (el(z) 十 上 xz)) 
解 此 方程 ,可 得 


1— p(xz) 


t(x) = SCZ) 十 Ps] 


e(CZ) 


7.4.1 7 后 问题 


nn 后 问题 是 提供 了 设计 高 效 的 拉 斯 维 加 斯 算法 的 一 个 很 好 的 例子 。 在 用 回溯 法 解 ”后 
问题 时 ,实际 上 是 在 系统 地 搜索 整个 解 空间 树 的 过 程 中 找 出 满足 要 求 的 解 。 往 往 忽 略 了 一 
个 重要 事实 : 对 于 后 问题 的 任何 一 个 解 而 言 ,每 一 个 皇后 在 棋盘 上 的 位 置 无 任何 规律 ,不 
具有 系统 性 ,而 更 像 是 随机 放置 的 。 由 此 容易 想到 下 面 的 拉 斯 维 加 斯 算法 ,在 棋盘 上 相继 的 
各 行 中 随机 地 放置 皇后 ,并 注意 使 新 放置 的 皇后 与 已 放置 的 皇后 互 不 攻击 ,直至 盖 个 皇后 均 
已 相 容 地 放置 好 ,或 者 已 没有 下 一 个 皇后 的 可 放置 位 置 时 为 止 。 

具体 算法 可 描述 如 下 。 

类 LVQueen 的 数据 成 员 n 表示 皇后 个 数 ,数组 x 存储 后 问题 的 解 。 


public class LVQueen 


static Random rnd; // 随 机 数 产 生 器 
static int n; // 皇 后 个 数 
static int [] x; // 解 向 量 


} 
方法 place(k) 用 于 测试 将 皇后 置 于 第 z[k] 列 的 合法 性 。 


private static boolean place(int k) 

{// 测 试 皇后 k 置 于 第 x[kj 列 的 合法 性 
for (int j 王 15j 二 kj;j 十 十 ) 
if ((Math. abs(k—j)== Math. abs(x[j]—x[k]))||(x[j]== x[k])) return false; 
return true; 


} 
方法 queensLV() 实现 在 棋盘 上 随机 放置 个 皇后 的 拉 斯 维 加 斯 算法 。 


Private static boolean queensLV() 
{// 随 机 放置 n 个 皇后 的 拉 斯 维 加 斯 算法 
rnd 一 new Random(); // 初 始 化 随机 数 
int k=1; // 下 一 个 放置 的 皇后 编号 
int count 一 1; 
while ((k<—n) && (count>0)) 
{ 
count=0; 
int j 一 0; 
for (int i=1; i<—n; i 十 十 ) 


在 学 算法 


{ 第 
x[k]=i 7 
if (place(k)) 章 


让 (rnd. random( 十 十 count) ==0) j=i; // 随 机 位 置 
if (count>0) x[k 十 十 ] 一 j; 
大 
return (count>0); //count>0 表示 放置 成 功 
} 


类 似 于 算法 obstinate, 可 以 通过 反复 调用 随机 放置 个 皇后 的 拉 斯 维 加 斯 算法 
queensLV() ,直至 找到 后 问题 的 一 个 解 。 


public static void nQueen() 
{// 解 n 后 问题 的 拉 斯 维 加 斯 算法 
// 初 始 化 x 
x=new int[n 二 1]; 
for (int i=0; i<=n; i 十 十 ) x[i]=0; 
// 反 复 调用 随机 放置 n 个 皇后 的 拉 斯 维 加 斯 算法 ,直至 放置 成 功 
while (! queensLV()) ; 
} 


上 述 算法 一 旦 发 现 无 法 再 放置 下 一 个 皇后 ,就 全 部 重新 开始 ,这 似乎 过 于 翡 观 。 如 果 将 
上 述 随 机 放置 策略 与 回溯 法 相 结合 ,可 能 会 获得 更 好 的 效果 。 可 以 先 在 棋盘 的 若干 行 中 随 
机 地 放置 皇后 ,然后 在 后 继 行 中 用 回溯 法 继续 放置 ,直至 找到 一 个 解 或 宣告 失败 。 随 机 放置 
的 皇后 越 多 ,后 继 回 溯 搜 索 所 需 的 时 间 就 越 少 ,但 失败 的 概率 也 就 越 大 。 
与 回溯 法 相 结 合 的 解 n 后 问题 的 拉 斯 维 加 斯 算法 描述 如 下 : 
public class LVQueenl 
{ 
static Random rnd; 
static int nj; 
static int [] x; 


static int [] y; 


: 


方法 place(k) 用 于 测试 将 皇后 置 于 第 z[k] 列 的 合法 性 。 方 法 backtrack( 四 是 解 n 后 
问题 的 回溯 法 。 


private static boolean place(int k) 

{// 测 试 皇 后 k 置 于 第 x[Lk] 列 的 合法 性 
for (int j 王 1;j 二 k;j 十 十 ) 
if ((Math. abs(k—j)== Math. abs(x[j]— x[k]))||(x0]== x[k])) return false; 
return true; 


} 


private static void backtrack(int t) 


算法 设计 与 分 折 ( 艇 工厂 ) 


{// 解 n 后 问题 的 回溯 法 
if (t>m { 
for (int i=1;i<=n;it+) 
y[i]=x[i]; 
return; 
和 
else 
for (int i 一 1;i< 一 nji 十 十 ) { 
x[t]=i; 
if (place(t)) backtrack(t+1); 
了 
} 


方法 queensLV(stopVegas) 实现 在 棋盘 上 随机 放置 若干 个 皇后 的 拉 斯 维 加 斯 算法 。 
其 中 ,1 三 stopVegas 三 n 表示 随机 放置 的 皇后 数 。 


Private static boolean queensLV(int stopVegas) 
{ // 随 机 放置 n 个 皇后 拉 斯 维 加 斯 算法 
rnd = new Random(); // 初 始 化 随机 数 
int k=1; // 下 一 个 放置 的 皇后 编号 
int count 一 1; 
//1<= stopVegas<==n 表示 允许 随机 放置 的 皇后 数 
while ((k<= stopVegas) && (count>0)) { 
count=0; 
int j 一 0; 
for (int i=1; i<=n; i 十 十 ) { 
x[k]=i; 
if (place(k)) 
让 (rnd. random( 十 十 count) 二 ==0) j= 二 i; ”// 随 机 位 置 
} 
if (count>0) x[k 十 十 ] 王 j; 
} 
return (count>0); //count>0 表示 放置 成 功 


算法 的 回溯 搜索 部 分 与 解 n 后 问题 的 回溯 法 是 类 似 的 ,所 不 同 的 是 这 里 只 要 找到 一 个 
解 就 可 以 了 。 
public static void nQueen(int stop) 
{// 与 回溯 法 相 结 合 的 解 n 后 问题 的 拉 斯 维 加 斯 算法 
x 一 new int [n 十 1]; 
y=new int [n 十 1]; 
for (int i=0; i<—n; i 十 十 ){ 
x[i]=0; 
y[i]=0; 
} 
while (! queensLV (stop)); 


在 学 算法 


// 算 法 的 回溯 搜索 部 分 
backtrack(Cstop 十 1); 
} 


下 面 的 表 7-1 给 出 了 用 上 述 算法 解 8 后 问题 时 ,不 同 的 stopVegas 值 (包括 算法 成 功 的 
概率 p ,一 次 成 功 搜索 访问 的 结 点 数 平均 值 ;一 次 不 成 功 搜索 访问 的 结 点 数 平均 值 e 以 及 
反复 调用 算法 最 终 找 到 一 个 解 所 访问 的 结 点 数 的 平均 值 1 二 :十 (1 一 p)e/p) 相 对 应 的 算法 
效率 

表 7-1 解 8 后 问题 的 拉 斯 维 加 斯 算法 中 ,不 同 的 stopVegas 值 相对 应 的 算法 效率 


stopVegas p 5 e t 
0 1.0000 114.00 Ps 114. 00 
1 1. 0000 39.63 39. 63 
2 0. 8750 22. 53 39. 67 28. 20 
3 0. 4931 13. 48 15. 10 29.01 
4 0.2618 10.31 8.79 35. 10 
5 0. 1624 9. 33 T2909 46. 92 
6 0.1375 9.05 6.98 53.50 
7 0. 1293 9.00 6.97 55. 93 
8 0. 1293 9.00 6.97 55. 93 


stopVegas 一 0 对 应 于 完全 使 用 回溯 法 的 情形 。 
表 7-2 是 解 12 后 问题 的 拉 斯 维 加 斯 算法 中 不 同 的 stopVegas 值 相对 应 的 算法 效率 。 
由 此 可 以 看 出 , 当 n==12 时 , 取 stopVegas 二 5, 算 法 效率 很 高 。 


表 7-2 解 12 后 问题 的 拉 斯 维 加 斯 算法 中 不 同 的 stopVegas 值 相 对 应 的 算法 效率 


stopVegas p s e t 
0 1.0000 262. 00 < 262. 00 
5 0. 5039 33.88 47.23 80. 39 
12 0.0465 13.00 10. 20 222. 11 


7.4.2 整数 因子 分 解 


设 "1 是 一 个 整数 。 关 于 整数 的 因子 分 解 问 题 是 找 出 n 的 如 下 形式 的 唯一 分 解 式 
N = pr pr "pr 

其 中 ,pi 二 ps 二 … 二 ps 是 个 素数 ,ma ,ms，… ,ms 是 个 正 整 数 。 

如 果 是 一 个 合 数 , 则 n 必 有 一 个 非 平 凡 因子 z+ ,1 二 xn, 使 得 z 可 以 整除 nn。 

给 定 一 个 合 数 , 求 n 的 一 个 非 平凡 因子 的 问题 称 为 整数 n 的 因子 分 割 问题 。 

在 本 章 的 7. 5 节 中 会 讨论 一 个 用 于 测试 给 定 整 数 的 素性 的 蒙特 卡 罗 算法 。 有 了 测试 素 
性 的 算法 后 ,整数 的 因子 分 解 问题 就 转化 为 整数 的 因子 分 割 问 题 。 

下 面 的 算法 split(n) 可 实现 对 整数 的 因子 分 割 。 


private static int split(int n) 


{ 


站 法 讼 计 与 分 原 (第 4 版 ) 


int m = (int) Math. floor(Math. sqrt( (double)n)); 
for (int i=2; i<—m; i 十 十 ) 

让 (n%i==0) return i; 

return 1; 


在 最 坏 情况 下 ,算法 split(n) 所 需 的 计算 时 间 为 Q(Yn)。 当 nn 较 大 时 ,上 述 算法 无 法 在 
可 接受 的 时 间 内 完成 因子 分 割 任务 。 对 于 给 定 的 正 整 数 n, 设 其 位 数 为 m=[logio (1 十 n) ]。 
由 Vn 二 0(10”) 知 ,算法 split(n) 是 关于 m 的 指数 时 间 算 法 。 

到 目前 为 止 ,还 没有 找到 解 因子 分 割 问题 的 多 项 式 时 间 算 法 。 事 实 上 ,算法 split(n) 是 
对 在 1 一 z 的 所 有 整数 进行 了 试 除 而 得 到 在 1 一 zx? 的 任 一 整数 的 因子 分 割 。 下 面 要 讨论 的 
求 整数 的 因子 分 割 的 拉 斯 维 加 斯 算法 是 由 Pollard 提出 的 ,该 算法 的 效率 相 比 算法 split(n) 
有 较 大 的 提高 。Pollard 算法 用 与 算法 split(n) 相 同 的 工作 量 就 可 以 得 到 在 1 一 zx 六 范围 内 整 
数 的 因子 分 割 。 

Pollard 算法 在 开始 时 选取 0 一 * 一 1 范围 内 的 随机 数 zi ,然后 递归 地 由 

zi 一 (zz 一 1) modn 
产生 无 穷 序 列 zl ,zs ，… ,x ，…。 
对 于 i 二 2 ,二 0,1,… ,以 及 2 过 j 二 24+1 ,算法 计算 出 xz) 一 zx; 与 4 的 最 大 公 因子 
d = gcd(zxj — zxi»n) 

如 果 4 是 的 非 平 凡 因 子 , 则 实现 对 的 一 次 分 割 , 算 法 输出 的 因子 d。 

求 整 数 n 因子 分 割 的 拉 斯 维 加 斯 算法 pollard(n) 可 描述 如 下 。 其 中 ,gcd(a,5) 是 求 两 
个 整数 最 大 公 因 数 的 欧 几 里 得 算法 。 

Private static int gcd(int a, int b) 

{// 求 整数 a 和 b 最 大 公 因 数 的 欧 几 里 得 算法 

if (b==0) return a; 


else return gcd(b,a%b); 
} 


Private static void pollard(int n) 


{// 求 整数 n 因子 分 割 的 拉 斯 维 加 斯 算法 

rnd 一 new Random(); // 初 始 化 随机 数 

int i=1; 

int x 一 rnd. random(n); // 随 机 整数 

int y 一 xj 

int k=2; 

while (true) { 
计 十 3 
x 一 (xx x—1)%n; 
int d=gcd(y—x,n); // 求 n 的 非 平凡 因子 
if ((d>1) &&. (d<n)) System. out. println(d); 
if Ci==k) 《 


y=xs 


检 间 算法 


k*=2;} 


通过 对 Pollard 算法 更 深入 的 分 析 可 知 ,执行 算法 的 while 循环 约 Vp 次 后 ,Pollard 算法 
会 输出 nn 的 一 个 因子 p。 由 于 nn 的 最 小 素 因 子 p 二 Vn, 故 Pollard 算法 可 在 Ol ) 时 间 内 找 
到 ?的 一 个 素 因 子 。 
在 上 述 Pollard 算法 中 还 可 以 将 产生 序列 xz; 的 递归 式 改 成 
Xi 一 (zz 一 c) modn 


其 中 ,c 是 一 个 不 等 于 0 和 2 的 整数 。 


7.5 蒙特 卡 罗 算 法 


在 实际 应 用 中 常会 遇 到 一 些 问 题 ,不 论 采 用 确定 性 算法 或 概率 算法 都 无 法 保证 每 次 都 
能 得 到 正确 的 解答 。 蒙 特 卡 罗 算 法 则 在 一 般 情 况 下 可 以 保证 对 问题 的 所 有 实例 都 以 高 概率 
给 出 正确 解 , 但 是 通常 无 法 判定 一 个 具体 解 是 否 正确 。 


7.5.1 蒙 将 卡 罗 算 法 的 基本 思想 
设 p 是 一 个 实数 , 且 方 <p<1。 如 果 一 个 蒙特 卡 罗 算 法 对 于 问题 的 任 一 实例 得 到 正确 


解 的 概率 不 小 于 p, 则 称 该 蒙特 卡 罗 算 法 是 p 正确 的 , 且 称 /一 去 是 该 算法 的 优势 。 


如 果 对 于 同一 实例 ,蒙特 卡 罗 算 法 不 会 给 出 两 个 不 同 的 正确 解答 , 则 称 该 蒙特 卡 罗 算 法 
是 一 致 的 。 

有 些 蒙 特 卡 罗 算 法 除了 具有 描述 问题 实例 的 输入 参数 外 ,还 具有 描述 错误 解 可 接受 概 
率 的 参数 。 这 类 算法 的 计算 时 间 复 杂 性 通常 由 问题 的 实例 规模 以 及 错误 解 可 接受 概率 的 函 
数 来 描述 。 

对 于 一 个 一 致 的 p 正确 的 蒙特 卡 罗 算 法 ,要 提高 获得 正确 解 的 概率 ,只 要 执行 该 算法 
若干 次 ,并 选择 出 现 频 次 最 高 的 解 即 可 。 


在 一 般 情 况 下 , 设 e 和 6 是 2 个 正 实数 , 且 e+8< 去 。 设 MCCm) 是 一 个 一 致 的 [二 +e] 


正确 的 蒙特 卡 罗 算法 , 且 C: 一 一 2/log(1 一 4e)。 如 果 调用 算法 MCCz) 至 少 |C log | 次 ， 


并 返回 各 次 调用 出 现 频数 最 高 的 解 ,就 可 以 得 到 解 同 一 问题 的 一 个 一 致 的 (1 一 5) 正确 的 蒙 
特 卡 罗 算 法 。 由 此 可 见 , 不 论 算法 MCCz) 的 优势 。>0 多 小 ,都 可 以 通过 反复 调用 来 放大 算 
法 的 优势 ,使 得 最 终 得 到 的 算法 具有 可 接受 的 错误 概率 。 


要 证 明 上 述 论断 , 设 n>C; log 1/8 是 重复 调用 [ 去-+e 正确 的 算法 MC(z) 的 次 数 , 且 


” 全 + 1—p (3 em Ln/2 |+1。 经 次 反复 调用 算法 MC(z) ,找到 问题 的 
一 个 正确 解 , 则 该 正确 解 至 少 应 出 现 m 次 ,因此 其 出 现 错误 概率 最 多 是 


熙 法 讼 计 与 分 原 ( 黎 工 版 ) 


py Prob{n 次 调用 出 现 i 次 正确 解 } 
ml 
< 互生 
ml n 
一 (pg)w2 > ( J py 
i=0 \1 


ml 
<00"5( 


i=0 


"| (由 于 g/p 二 1, 且 nn/2 一 i 之 0) 


1 
<00"*D()- (pq) 2" 
i=0 \1 


=4(pgq)™* — (1— 4e’)"™ 

魏 (1 一 4e2)% 人 log(1/6) (由 于 0 二 (1 一 4e:) 二 1) 

=27%0/ = 6 〈 由 于 对 任意 z 盖 0 有 ze 一 2) 
由 此 可 知 ,重复 n 次 调用 算法 MC(z) 得 到 正确 解 的 概率 至 少 为 1 一 6。 


更 进一步 的 分 析 表 明 , 如 果 重复 调用 一 个 一 至 的 (方正 确 的 这 特 卡 罗 算法 2 一 1 
次 ,得 到 正确 解 的 概率 至 少 为 1 一 5, 其 中 ， 
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4e Vam 
在 实际 使 用 中 ,大 多 数 蒙特 卡 罗 算 法 经 重复 调用 后 其 正确 率 提高 很 快 。 
设 MC(z) 是 解 某 个 判定 问题 D 的 蒙特 卡 罗 算 法 。 当 MC(z) 返 回 true 时 解 总 是 正确 
的 , 仅 当 它 返回 false 时 有 可 能 产生 错误 的 解 , 称 这 类 的 蒙特 卡 罗 算 法 为 偏 真 算法 。 
显而易见 , 当 多 次 调用 一 个 偏 真 蒙特 卡 罗 算 法 时 ,只 要 有 一 次 调用 返回 true, 就 可 以 断 
定 相应 的 解 为 true。 稍 后 将 看 到 在 这 种 情况 下 只 要 重复 调用 偏 真 蒙特 卡 罗 算 法 4 次 ,就 可 
以 将 解 的 正确 率 从 55% 提 高 到 95% ,重复 调用 算法 6 次 ,可 将 解 的 正确 率 提高 到 99%。 而 


且 对 于 偏 真 蒙 特 卡 罗 算 法 而 言 ,原来 对 p 正确 算法 的 要 求 二 去 可 以 放松 为 p>0 即 可 。 


现在 回 到 一 般 的 问题 , 即 所 讨论 的 问题 不 一 定 是 一 个 判定 问题 。 设 y。 是 所 求解 问题 的 
一 个 特殊 的 解答 ,如 判定 问题 的 true 解答 。 对 于 一 个 解 所 给 问题 的 蒙特 卡 罗 算 法 MC(z)， 
如 果 存 在 问题 实例 的 子 集 X ,使 得 

(1) 当 zE&X 时 ,MCCz) 返 回 的 解 是 正确 的 。 

(2) 当 zEX 时 ,正确 解 是 w ,但 MC(Cz) 返 回 的 解 未 必 是 yo。 
则 称 上 述 算法 MC(z) 是 偏 w 的 算法 。 

设 MC(z) 是 一 个 一 致 的 .p 正确 偏 yo 蒙特 卡 罗 算法 。MC(z) 返 回 的 解 为 yo。。 接 下 来 
讨论 以 下 两 种 情况 。 

1) y 二 yo 的 情况 

此 时 ,MC(z) 返 回 的 解 是 正确 的 。 

事实 上 , 当 zEX 时 ,MCCz) 返 回 的 解 总 是 正确 的 ; 当 zEX 时 ,正确 解 是 yo ,故此 时 算 
法 返回 的 解 也 是 正确 的 。 


规 间 算法 


2) > 天 yw 的 情况 

在 这 种 情况 下 , 当 xz&X 时 ,y 是 正确 的 ; 当 zEX 时 ,y 是 错误 的 。 因 为 此 时 正确 解 是 
y ,而 y 隆 yo。。 但 是 由 于 算法 是 p 正确 的 ,产生 这 种 错误 的 概率 不 超过 1 一 p。 

在 一 般 情况 下 ,如 果 重复 上 次 调用 MC(z), 所 返回 的 解 依次 为 yy ,… ,yi; 则 

(1) 存在 i 使 y; 王 yo, 此 时 yo 为 正确 解 。 

(2) 存在 i 隆 j ,使 得 y; 隆 yj ;此 时 必 有 xzEX, 因 此 可 知 正确 解 为 yo。 

(3) 对 所 有 i 有 yi 二 y, 但 y 关 yo; 此 时 ,正确 解 仍 有 可 能 是 yo 。 

如 果 情 形 (3) 发 生 , 则 每 一 次 调用 MC(z) 均 产生 错误 解 y, 但 发 生 这 种 情况 的 概率 不 超 
过 (1 一 p)*。 

由 上 面 的 讨论 可 知 ,重复 调用 一 个 一 致 的 、p 正确 偏 y。 蒙特 卡 罗 算 法 次 ,可 得 到 一 个 
(一 一 p)*) 正 确 的 蒙特 卡 罗 算 法 , 且 所 得 算法 仍 是 一 个 一 致 的 偏 w 蒙特 卡 罗 算法 。 特 别 
地 ,调用 一 个 偏 真 蒙特 卡 罗 算 法 次 可 将 其 正确 概率 从 p 提高 到 (1 一 (1 一 p)*)。 


7.5.2 主 元 素 问 题 


设 T[1:n]j 是 一 个 含有 个 元 素 的 数组 。 当 |{i|T[i]=x} | 二 名 时 , 称 元 素 工 是 数组 


的 主 元 素 。 对 于 给 定 的 输入 数组 工 ,考虑 下 面 判 定 所 给 数组 了 是 否 含 有 主 元 素 的 蒙特 卡 风 
算法 majority。 
public static boolean majority(int[]t，int n) 
{// 判 定 主 元 素 的 蒙特 卡 罗 算 法 
rnd 一 new Random(); 
int i 一 rnd. random(Cn) 十 1; 
int x 三 t[]; // 随 机 选择 数组 元 素 
int k=0; 
for (int j 王 1;j< 一 nj;j 十 十 ) 
if (t[j]==x) k 十 十 
return (k>n/2); //k>n/2 时 t+ 含有 主 元 素 
} 


上 述 算法 对 随机 选择 的 数组 元 素 zx 测试 它 是 否 为 数组 T 的 主 元 素 。 如 果 算 法 返回 的 
结果 为 true, 即 随机 选择 的 数组 元 素 x 是 数组 T 的 主 元 素 , 则 显然 数组 了 含有 主 元 素 。 反 
之 ,如 果 算 法 返回 的 结果 为 false, 则 数组 工 未 必 没 有 主 元 素 。 可 能 数组 了 含有 主 元 素 , 而 


随机 选择 的 数组 元 素 = 不 是 了 的 主 元 素 。 由 于 数组 了 的 非 主 元 素 个 数 小 于 委 , 故 上 述 情况 
发 生 的 概率 小 于 去 。 由 此 可 见 , 上 述 判定 数组 的 主 元 素 存 在 性 算法 是 一 个 偏 真 的 去 正确 


算法 。 换 句 话 说 ,如 果 数 组 合 有 主 元 素 , 则 算法 以 大 于 喜 的 概率 返回 true; 如 果 数 组 工 没 
有 主 元 素 , 则 算法 肯定 返回 false。 

在 实际 使 用 时 ,50% 的 错误 概率 是 不 可 容忍 的 。 使 用 前 面 讨论 过 的 重复 调用 技术 可 将 
错误 概率 降低 到 任何 可 接受 值 的 范围 内 。 首 先 来 看 如 下 重复 调用 2 次 的 算法 majority2。 


~ 
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public static boolean majority2(int[ Jt, int n) 
{// 重 复 2 次 调用 算法 majority 

if (majority(t,n)) return true; 

else return majority(t,n); 


如 果 数 组 T 不 含 主 元 素 , 则 每 次 调用 majority (t,n) 返 回 的 值 肯定 是 false, 从 而 
majority2 返回 的 值 肯定 也 是 false。 如 果 数 组 T 含有 主 元 素 , 则 算法 majority(t,z) 返 回 


true 的 概率 2> 坪 ， 而 当 majority(t,n) 返 回 true 时 ,majority2 也 返回 true。 另 一 方面 ， 


majority2 的 第 一 次 调用 majority(t,z) 返 回 false 的 概率 为 1 一 p, 第 二 次 调用 majority(t,n) 
仍 以 概率 p 返回 true。 因 此 , 当 数 组 了 含有 主 元 素 时 ,majority2 返回 true 的 概率 是 p 十 


(一 PDp=1 一 (1 一 六 ?> 卫 。 也 就 是 说 ,算法 majority2 是 一 个 偏 真 3/4 正确 的 蒙特 卡 罗 


算法 。 
算法 majority2 中 ,重复 调用 majority(t,n) 所 得 到 的 结果 是 相互 独立 的 。 当 数组 丁 含 
有 主 元 素 时 , 某 次 调用 majority(t,n) 返 回 false 并 不 会 影响 下 一 次 调用 majority(t,n) 返回 
值 为 true 的 概率 。 因 此 ,k 次 重复 调用 majority(1,n) 均 返回 false 的 概率 小 于 2“。 男 一 方 
面 ,在 次 调用 中 ,只 要 有 一 次 调用 返回 的 值 为 true, 即 可 断定 数组 了 含有 主 元 素 。 
对 于 任何 给 定 的 e 二 0, 下 面 的 算法 majorityMC 重复 调用 [log (1/e) | 次 算法 majority。 
它 是 一 个 偏 真 蒙 特 卡 罗 算 法 , 且 其 错误 概率 小 于 se。 
public static boolean majorityMC(int[ Jt, int n, double e) 
{// 重 复 log(1/e) 次 调用 算法 majority 
int k= (int) Math. ceil(Math. log(1/e)/Math. log(2)); 
for (int i 一 1;i< 一 kj;i 十 十 ) 
if (majority(t,n)) return true; 


return false; 


|; 
算法 majorityMC 所 需 的 计算 时 间 显 然 是 O(n log(1/e))。 


7.5.3 素数 测试 


关于 素数 的 研究 已 有 相当 长 的 历史 ,近代 密码 学 的 研究 又 给 它 注入 了 新 的 活力 。 在 关 
于 素数 的 研究 中 素数 的 测试 是 一 个 非常 重要 的 问题 。Wilson 定理 给 出 了 一 个 数 是 素数 的 
充 要 条 件 。 

Wilson 定理 : 对 于 给 定 的 正 整数 n, 判 定 是 一 个 素数 的 充 要 条 件 是 (n 一 1)! 三 
一 1(Cmod n), 

Wilson 定理 有 很 高 的 理论 价值 。 但 是 ,实际 用 于 素性 测试 所 需 计 算 量 太 大 ,无 法 实现 
对 较 大 素数 的 测试 。 到 目前 为 止 ,尚未 找到 素数 测试 的 有 效 的 确定 性 算法 或 拉 斯 维 加 斯 算 
法 。 首 先 容易 想到 下 面 的 素数 测试 概率 算法 prime。 


public static boolean prime(int n) 
{ 
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rnd 一 new Random(); 

int m= (int) Math. floor(Math. sqrt( (double)n)); 
int a 一 rnd. random(m 一 2) 十 2; 

return (n%%al 一 0); 


算法 prime 返回 false 时 ,算法 幸运 地 找到 的 一 个 非 平凡 因子 ,因此 ,可 以 肯定 n 是 一 
个 合 数 。 但 是 ,对 于 上 述 算法 prime 来 说 ,即使 是 一 个 合 数 ,算法 仍 以 高 概率 返回 true。 
例如 , 当 n 二 2623 二 43X61 时 ,算法 prime 在 2 一 51 范围 内 随机 选择 一 个 整数 d, 仅 当选 择 
到 d 二 43 时 ,算法 返回 false, 其 余 情 况 均 返回 true。 在 2 一 51 范围 内 选 到 4 二 43 的 概率 约 为 
2% ,因此 ,算法 以 98% 的 概率 返回 错误 的 结果 true。 当 n 增 大 时 ,情况 就 更 糟 。 当 然 在 上 
述 算法 中 可 以 用 欧 几 里 得 算法 判定 与 4 是 否 互 素来 提高 测试 效率 ,但 结果 仍 不 理想 。 

著名 的 费 尔 马 小 定理 为 素数 判定 提供 了 一 个 有 力 的 工具 。 

费 尔 马 小 定理 : 如 果 p 是 一 个 素数 ,是 0 二 a<p, 则 a?!' 寺 1(mod p)。 

例如 ,67 是 一 个 素数 , 则 2% mod 67 一 1。 

利用 费 尔 马 小 定理 ,对 于 给 定 的 整数 ,可 以 设计 一 个 素数 判定 算法 。 通 过 计算 
d 二 2"”! mod n 来 判定 整数 n 的 素性 。 当 d 天 1 时 ,n 肯定 不 是 素数 ; 当 d= 二 1 时 ,n 则 很 可 能 
是 素数 。 但 是 ,也 存在 合 数 n 使 得 2”! 三 1(mod nn)。 例 如 ,满足 此 条 件 的 最 小 合 数 是 
n 二 341。 为 了 提高 测试 的 准确 性 ,可 以 随机 地 选取 整数 1 二 a 二 n 一 1, 然 后 用 条 件 a”' 三 1 
(mod nn) 来 判定 整数 的 素性 。 例 如 ,对 于 n=3 红 1, 取 a=3 时 ,有 3” 三 56(mod 341), 故 可 
判定 不 是 素数 。 

费 尔 马 小 定理 毕 竞 只 是 素数 判定 的 一 个 必要 条 件 。 满 足 费 尔 马 小 定理 条 件 的 整数 nn 未 
必 全 是 素数 。 有 些 合 数 也 满足 费 尔 马 小 定理 的 条 件 。 这 些 合 数 被 称 为 Carmichael 数 ,前 3 
个 Carmichael 数 是 561,1105 和 1729。Carmichael 数 是 非常 少 的 。 在 1 一 100 000 000 的 整 
数 中 ,只 有 255 个 Carmichael 数 。 

利用 下 面 的 二 次 探测 定理 可 以 对 上 面 的 素数 判定 算法 做 进一步 改进 ,以 避免 将 
Carmichael 数 当 作 素 数 。 

二 次 探测 定理 : 如 果 p 是 一 个 素数 , 且 0 二 x 二 p, 则 方程 xz? 二 1(mod p) 的 解 为 x 二 1， 
ls 
事实 上 ,zx? 夺 1(mod p) 等 价 于 x? 一 1 三 0(mod p)。 由 此 可 知 ,(zx 一 1) (zx 十 1) 夺 0(mod 
力 ) , 故 p 必须 整除 + 一 1 或 x 十 1。 由 pp 是 素数 且 0<x<p 推出 x 二 1 或 x=p 一 1。 

利用 二 次 探测 定理 ,可 以 在 利用 费 尔 马 小 定理 计算 a”! mod n 的 过 程 中 增加 对 整数 ?” 
的 二 次 探测 。 一 旦 发 现 违背 二 次 探测 条 件 , 即 可 得 出 不 是 素数 的 结论 。 

下 面 的 算法 power 用 于 计算 a? mod n, 并 在 计算 过 程 中 实施 对 的 二 次 探测 。 

private static int power(int a, int p, int n) 

{ // 计 算 mod n, 并 实施 对 n 的 二 次 探测 

int x, result; 

if (p==0) result=1; 

else { 
x= power(a,p/2,n); // 递 归 计 算 
result= (x * x) %n; // 二 次 探测 
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if ((result==1) &&(x! =D)&&(x!=n—1)) 
composite= true; 
if ((p%2)==1) //P 是 奇数 


result= (result * a) %ni 


return result; 


, 
在 算法 power 的 基础 上 ,可 设计 素数 测试 的 蒙特 卡 罗 算 法 prime 如 下 : 


public static boolean prime(int n) 
{ // 素 数 测试 的 蒙特 卡 罗 算 法 
rnd 一 new Random(); 
int a, result; 
composite=false; 
a 一 rnd. random(n—3)+2; 
result 一 power(ayn 一 1,n); 
if (composite| | (result! =1)) return false; 
else return true; 


, 


算法 prime 返回 false 时 ,整数 一 定 是 一 个 合 数 。 而 当 算法 prime 返回 的 值 为 true 
时 ,整数 在 高 概率 的 意义 下 是 一 个 素数 。 仍 然 可 能 存在 合 数 , 对 于 随机 选取 的 基数 a, 算 
法 返回 true。 但 对 于 上 述 算 法 的 深入 分 析 表 明 , 当 n 充分 大 时 ,这 样 的 基数 a 不 超过 (一 
9)/4 个 ,由 此 可 知 上 述 算法 prime 是 一 个 偏 假 3/4 正确 的 蒙特 卡 罗 算 法 。 

正如 前 面 讨论 过 的 ,上 述 算 法 prime 的 错误 概率 可 通过 多 次 重复 调用 而 迅速 降低 。 重 
复 上 次 调用 算法 prime 的 蒙特 卡 罗 算 法 primeMC 可 描述 如 下 : 


public static boolean primeMC(int n, int k) 
{ // 重 复 k 次 调用 算法 prime 的 蒙特 卡 罗 算 法 
rnd 一 new Random(); 
int a, result; 
composite= false; 
for (int i 一 1;i< 一 kj;i 十 十 ) 
{ 
a 一 rnd. random(n 一 3) 十 2; 
result= power(a,n—1,n); 
if (composite| | (result! =1)) return false; 
} 
return true; 


容易 得 出 算法 PrimeMC 的 错误 概率 不 超过 | 十】 。 这 是 一 个 很 保守 的 估计 ,实际 使 用 
的 效果 要 好 得 多 。 


规 音 算法 


~ 


小 结 


确定 性 算法 的 每 一 个 计算 步骤 都 是 确定 的 ,本 章 所 讨论 的 概率 算法 允许 算法 在 执行 过 
程 中 随机 地 选择 下 一 个 计算 步 又。 在 许多 情况 下 , 当 算 法 在 执行 过 程 中 面临 一 个 选择 时 , 随 
机 性 选择 常 比 最 优选 择 省 时 。 因 此 ,概率 算法 可 在 很 大 程度 上 降低 算法 的 复杂 度 。 本 章 讨 
论 了 4 类 常用 的 概率 算法 : 数值 概率 算法 .蒙特 卡 罗 算 法 , 拉 斯 维 加 斯 算法 和 使 伍德 算法 。 

数值 概率 算法 常用 于 数值 问题 的 求解 。 在 许多 情况 下 ,计算 问题 的 精确 解 是 不 可 能 或 
没有 必要 的 ,而 用 数值 概率 算法 可 以 得 到 相当 满意 的 解 。 

蒙特 卡 罗 算 法 得 到 的 解 未 必 是 正确 的 。 解 的 正确 概率 依赖 于 算法 所 用 的 时 间 。 算 法 所 
用 的 时 间 越 多 ,得 到 正确 解 的 概率 就 越 大 。 和 蒙特 卡 罗 算 法 的 主要 缺点 也 在 于 此 。 

拉 斯 维 加 斯 算法 找到 的 解 一 定 是 正确 解 。 但 有 时 用 拉 斯 维 加 斯 算法 找 不 到 解 。 与 蒙特 
卡 罗 算 法 类 似 , 拉 斯 维 加 斯 算法 找到 正确 解 的 概率 依赖 于 所 用 的 计算 时 间 。 对 于 待 求解 问 
题 的 任 一 实例 ,用 同一 拉 斯 维 加 斯 算法 反复 求解 足够 多 次 ,可 使 求解 失败 的 概率 任意 小 。 

舍 伍 德 算法 总 能 求 得 问题 的 正确 解 。 当 一 个 确定 性 算法 在 最 坏 情况 下 的 计算 复杂 人 性 与 
其 在 平均 情况 下 的 计算 复杂 性 有 较 大 差别 时 ,在 这 个 确定 性 算法 中 引入 随机 性 将 它 改造 成 
会 伍德 型 算法 ,消除 或 减少 问题 的 好 坏 实例 间 的 差别 。 售 伍德 算法 的 精 散 不 是 避免 算法 的 
最 坏 情 况 , 而 是 设法 消除 最 坏 情形 与 特定 实例 之 间 的 关联 。 


习 题 


7-1 在 实际 应 用 中 , 常 需 模拟 服从 正 态 分 布 的 随机 变量 ,其 密度 函数 为 


1 [ET 


e 2 


其 中 ,a 为 均值 ,o 为 标准 差 。 
如 果 s 和 + 上 是 (一 1,1) 中 均匀 分 布 的 随机 变量 , 且 昱 十 正二 1, 令 : p= 二 5 十 ,gq 二 
VM( 一 2Inp)/pwu 二 sqv 二 tq; 则 w 和 w 是 服从 标准 正 态 分 布 (a 二 0,c==1) 的 两 个 互相 独 
立 的 随机 变量 。 
(1) 利用 上 述 事实 ,设计 一 个 模拟 标准 正 态 分 布 随机 变量 的 算法 。 
(2) 将 上 述 算法 扩展 到 一 般 的 正 态 分 布 。 

7-2 设 有 一 个 文件 含有 个 记录 。 
(1) 试 设计 一 个 算法 随机 抽取 该 文件 中 mm 个 记录 。 
(2) 如 果 事 先 不 知道 文件 中 记录 个 数 , 应 如 何 随机 抽取 其 中 的 mx 个 记录 ? 

7-3” 试 设计 一 个 算法 随机 地 产生 在 1~~n 中 的 m 个 随机 整数 , 且 要 求 这 m 个 随机 整数 互 不 
相同 。 

7-4 设 X 是 含有 7 个 元 素 的 集合 ,从 X 中 均匀 地 选取 元 素 。 设 第 & 次 选取 时 首次 出 现 
(1) 试 证 明 当 充分 大 时 ,k 的 期 望 值 为 8Vn ,其 中 B= Vx/2 一 1.253。 
(2) 由 此 设计 一 个 计算 给 定 集 合 X 中 元 素 个 数 的 概率 算法 。 
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7-5 
Te 


7 


7-8 


7-9 


7-10 


7-12 


试 设计 一 个 概率 算法 计算 365! /340! 。365”, 并 精确 到 4 位 有 效 数字 。 

一 个 问题 是 易 验 证 的 是 指 对 该 问题 的 给 定 实例 的 每 一 个 解 , 都 可 以 有 效 地 验证 其 正确 

性 。 例 如 , 求 一 个 整数 的 非 平凡 因子 问题 是 易 验 证 的 ,而 求 一 个 整数 的 最 小 非 平凡 因 

子 就 不 是 易 验证 的 。 在 一 般 情况 下 , 易 验证 问题 未 必 是 易 解 的 。 

(1) 给 定 一 个 解 易 验证 问题 P 的 蒙特 卡 罗 方 法 ,由 此 设计 一 个 相应 的 解 问题 P 的 拉 斯 

维 加 斯 算法 。 
(2) 给 定 一 个 解 易 验证 问题 P 的 拉 斯 维 加 斯 算法 ,由 此 设计 一 个 相应 的 解 问题 P 的 蒙 
特 卡 罗 算 法 。 

用 数组 模拟 有 序 链表 的 数据 结构 ,设计 支持 下 列 运算 的 舍 伍 德 型 算法 ,并 分 析 各 运算 

所 需 的 计算 时 间 。 

(1) Predeceessor: 找 出 一 给 定 元 素 xz 在 有 序 集 S 中 的 前 驱 元 素 。 

(2) Successor: 找 出 一 给 定 元 素 x 在 有 序 集 S 中 的 后 继 元 素 。 

(3) Min: 找 出 有 序 集 S 中 的 最 小 元 素 。 

(4) Max: 找 出 有 序 集 S 中 的 最 大 元 素 。 

采用 数组 模拟 有 序 链表 的 数据 结构 ,设计 一 个 舍 伍 德 型 排序 算法 ,使 得 算法 最 坏 情 况 

下 的 平均 计算 时 间 为 O00)。 

如 果 对 于 某 一 个 n 的 值 ,n 后 问题 无 解 , 则 算法 将 陷入 死 循环 。 

(1) 证 明 或 否定 下 述 论断 : 对 于 n 三 4,n 后 问题 有 解 。 

(2) 是 否 存 在 一 个 正 数 6, 使 得 对 所 有 nn 三 4 算法 成 功 的 概率 至 少 是 6。 
假设 已 有 一 个 算法 Prime(n) 可 用 于 测试 整数 是否 为 一 素数 。 另 外 ,还 有 一 个 算法 
Split(n) 可 实现 对 合 数 的 因子 分 割 。 试 利用 这 两 个 算法 设计 一 个 对 给 定 整 数 进 
行 因子 分 解 的 算法 。 

(1) 试 证 明 下 面 的 算法 primality 能 以 80% 以 上 的 正确 率 判定 给 定 的 一 个 整数 是 
否 为 素数 。 另 一 方面 , 举 出 整数 ”的 一 个 例子 表明 算法 对 此 整数 ”总 是 给 出 错 
误 的 解答 ,进而 说 明 该 算法 不 是 一 个 蒙特 卡 罗 算 法 。 
public static boolean primality(int n) 

{ 
if (gcd(n,30030)==1) return true; 


else return false; 


} 


(2) 试 找 出 上 述 算法 primality 中 可 用 于 替换 整数 30 030 的 另 一 个 整数 ,使 得 用 此 整 
数 代替 30 030 后 ,算法 的 正确 率 提高 到 85% 以 上 , 且 人 允许 使 用 非常 大 的 整数 。 
设 mc(z) 是 一 个 一 致 的 75% 正 确 的 蒙特 卡 罗 算 法 ,考虑 下 面 的 算法 : 


public static int mc3(int x) 
{ 

int tyuyvV; 

t 一 mcCx); 

u 一 mcCx); 


v 一 mcCx); 


7-13 


7-14 


7-15 


在 学 算法 


if ((t==W||(t==W) return t; 
return vs; 


} 


(1) 试 证 明 上 述 算法 mc3(z) 是 一 致 的 27/32 正确 的 算法 ,因此 是 84% 正 确 的 。 

(2) 试 证 明 如 果 mc(z) 不 是 一 致 的 , 则 mc3(z) 的 正确 率 有 可 能 低 于 71%。 

设 I=={1,2,…,n},SSI 是 了 的 一 个 子 集 。mc(z) 是 一 个 偏 假 p 正确 的 蒙特 卡 罗 算 
法 。 该 算法 用 于 判定 所 给 的 整数 1 二 xn 是 否 为 集合 S 中 的 整数 , 即 zxES。 设 g= 
1 一 p。 由 偏 假 算法 的 定义 可 知 ,对 任意 xzES 有 Prob{mc(x) 二 true}= 二 1。 当 x&5S 
时 ,Prob{mc(x) 二 true} 达 gq。 考虑 下 面 的 产生 S 中 随机 元 素 的 算法 genRand。 


public static boolean repeatMC(int x,int k) 
{ 
int i 一 0; 
boolean ans= true; 
while (ans&. &(i<k)) 
{ 
ts 
ans=mcl(x); 
} 
return ans; 


} 


public static int genRand(int n,int k) 
人 
rnd 一 new Random(); 
int x 一 rnd. random(n) 二 1; 
while (! repeatMC(Cx,k)) x 一 rnd. random(n) 十 1; 
Teturn x; 


假设 由 诸 句 xz 一 rnd. random(z) 十 1 产生 的 整数 zxES 的 概率 为 7 ,证 明 算法 genRand 


返回 的 整数 不 在 S 中 的 概率 最 多 为 一 一 一 。 
Ph 
设 算法 a 和 4 是 解 同一 判定 问题 的 两 个 有 效 的 蒙特 卡 罗 算 法 。 算 法 a 是 一 个 p 正确 
的 偏 真 算法 ,算法 5b 则 是 一 个 g 正确 偏 假 算法 。 试 利用 这 两 个 算法 设计 一 个 解 同一 
问题 的 拉 斯 维 加 斯 算法 ,并 使 所 得 到 的 算法 对 任何 实例 的 成 功率 尽 可 能 高 。 
考虑 下 面 的 无 限 循环 算法 : 
public static void printPrimes() 
{ 
System. out. println('2) ; 
System. out. println(’3"); 
int n=5; 


while (true) 


~ 
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{ 
int m = (int) Math. floor(Math. log( (double)n)); 
if (primeMC(n,m)) System. out. println(n); 
n=n+2; 
} 
} 


易 知 ,每 一 个 素数 都 会 被 上 述 算法 输出 。 但 是 除了 所 有 素数 外 ,算法 可 能 偶尔 错误 地 
输出 某 些 合 数 。 说 明 上 述 情 况 不 太 可 能 发 生 。 或 更 精确 地 ,证 明 上 述 算法 错误 地 输 
出 1 个 合 数 的 概率 小 于 1% 。 


给 定 3 个 zx 矩阵 志和 e, 下 面 的 偏 假 序 正 确 的 蒙特 卡 罗 算 法 用 于 判定 ob 一 。 


public static boolean product(double [J[ Ja, double [J[Jb, double CJL]e, int n) 
{// 判 定 ab=e 的 蒙特 卡 罗 算 法 
rnd 一 new Random(); 
double [J]x=new double [n+1]; 
double [Jy=new double [n+1]; 
double [J]z=new double [n+1]; 
for (int i=1;i<=n;i++) 
{ 
x[i]=rnd. random(2); 
if (x[i]==0) x[i]=—1; 
” 
mult(b,x,y,n); 
mult(asy,z,n); 
mult(c,x,y,n); 
for (int i 王 1;i< 一 nii 十 十 ) 
if (y[i]! =z[i]) return false; 
return true; 


} 
算法 所 需 的 计算 时 间 为 O(n?)。 显 然 当 ab 二 c 时 ,算法 product(a,b,c,n) 返 回 true。 
试 证 明 当 ab 去 c 时 ,算法 返回 值 为 false 的 概率 至 少 为 方 (提示 : 考虑 矩阵 ab 一 ,并 证 


明 当 ab 关 c 时 ,将 该 矩阵 各 行 相 加 或 相 减 最 终 得 到 的 行 向 量 至 少 有 一 半 是 非 零 
向 量 ) 。 


= 
NP 完全 性 理论 与 近似 算法 


在 计算 机 算法 理论 中 ,最 深刻 的 问题 之 一 是 “从 计算 的 观点 来 看 ,要 解决 的 问题 的 内 在 
复杂 性 如 何 ?" 它 是 * 易 ”计算 的 还 是 “ 难 ? 计 算 的 ? 如 果 知 道 了 一 个 问题 的 计算 时 间 下 界 ,就 
知道 了 对 于 该 问题 能 设计 出 多 有 效 的 算法 。 从 而 可 以 较 正确 地 评价 已 对 该 问题 提出 的 各 种 
算法 的 效率 ,并 进而 确定 对 已 有 算法 还 有 多 少 改进 的 余地 。 在 许多 情况 下 ,要 确定 一 个 问题 
的 内 在 计算 复杂 性 是 很 困难 的 。 已 创造 出 的 各 种 分 析 问 题 计算 复杂 性 的 方法 和 工具 ,可 以 
较 准 确 地 确定 许多 问题 的 计算 复杂 性 。 

问题 的 计算 复杂 性 可 以 通过 解决 该 问题 所 需 计算 量 的 多 少 来 度量 。 如 何 区 分 一 个 问题 
是 “ 易 " 还 是 “ 难 " 呢 ?人 们 通常 将 可 在 多 项 式 时 间 内 解决 的 问题 看 作 是 “ 易 ” 解 问题 ,而 将 需 
要 指数 函数 时 间 解 决 的 问题 看 作 是 “ 难 ” 问 题 。 这 里 所 说 的 多 项 式 时间 和 指数 函数 时 间 是 针 
对 问题 的 规模 而 言 , 即 解决 问题 所 需 的 时 间 是 问题 规模 的 多 项 式 还 是 指数 函数 。 对 于 实际 
遇 到 的 许多 问题 ,人 们 至 今 无 法 确切 了 解 其 内 在 的 计算 复杂 性 。 因 此 ,只 能 用 分 类 的 方法 将 
计算 复杂 性 大 致 相同 的 问题 归 类 进行 研究 。 而 对 于 能 够 进行 较 彻 底 分 析 的 问题 则 尽 可 能 准 
确 地 确定 其 计算 复杂 性 ,从 而 获得 对 它 的 深刻 理解 。 

本 章 要 研究 一 类 有 趣 的 NP 类 问题 和 解决 这 类 问题 的 近似 算法 。 这 类 问题 的 计算 复杂 
性 状况 至 今 是 未 知 的 ,许多 现象 说 明 这 类 问题 可 能 是 “ 难 " 解 的 。 在 NP 类 问题 中 有 一 类 问 
题 构 成 了 NP 类 问题 的 核心 ,它们 也 许 是 NP 类 中 最 难 的 问题 ,这 就 是 下 面 要 详细 讨论 的 
NP 完全 问题 。NP 完全 问题 的 困难 性 体现 在 任何 一 个 NP 类 问题 可 以 在 多 项 式 时 间 内 变 
换 为 一 个 NP 完全 问题 。 


8.1 PP 类 与 NP 类 问题 


本 书 中 的 许多 算法 都 是 多 项 式 时 间 算 法 , 即 对 规模 为 ”的 输入 ,算法 在 最 坏 情况 下 的 计 
算 时 间 为 00x*) ,k 为 一 个 常数 。 是 否 所 有 的 问题 都 在 多 项 式 时 间 内 可 解 呢 ? 回答 是 否定 
的 。 例 如 ,存在 一 些 不 可 解 问题 ,如 著名 的 “图 灵 停 机 问题 *。 任 何 计算 机 不 论 耗 费 多 少时 间 
也 不 能 求解 该 问题 。 此 外 ,还 有 一 些 问 题 ,虽然 可 以 用 计算 机 求解 ,但 是 对 任意 常数 ,它们 
都 不 能 在 OG ) 的 时 间 内 得 到 解答 。 一 般 地 说 ,将 可 由 多 项 式 时间 算 法 求解 的 问题 看 作 是 
易 处 理 的 问题 ,而 将 需要 超 多 项 式 时 间 才 能 求解 的 问题 看 作 是 难处 理 的 问题 。 有 许多 问题 ， 
从 表面 上 看 似乎 并 不 比 排序 或 图 的 搜索 等 问题 更 困难 ,然而 至 今 人 们 还 没有 找到 解决 这 些 
问题 的 多 项 式 时 间 算 法 ,也 没有 人 能 够 证 明 这 些 问 题 需要 的 超 多 项 式 时 间 下 界 。 也 就 是 说 ， 
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在 图 灵机 计算 模型 下 ,这 类 问题 的 计算 复杂 性 至 今 未 知 。 为 了 研究 这 类 问题 的 计算 复杂 人性， 
人 们 提出 了 另 一 个 能 力 更 强 的 计算 模型 , 即 非 确 定性 图 灵机 计算 模型 (nondeterministic 
Turing machine, NDTM) 。 在 这 个 计算 模型 下 ,许多 问题 就 可 以 在 多 项 式 时 间 内 求解 。 


8.1.1 非 确定 性 图 灵机 


一 个 & 带 非 确定 性 图 灵机 M 是 一 个 7 元 组 : (Q,T,1,6,6,qo。，,q;)。 与 确定 性 图 灵机 不 
同 的 是 非 确定 性 图 灵机 人 允许 9$ 具有 不 确定 性 , 即 对 于 QX Tr 中 的 每 一 个 值 (g; zx ,zx ，…， 
Xk) , 当 它 属于 6 的 定义 域 时 ,QX (TX {L,R,S}))* 中 有 唯一 的 一 个 子 集 6 (gq; ,X21) 
与 之 对 应 。 可 以 在 6(g;z1 ,zs，… ,zi) 中 随意 选 定 一 个 值 作为 它 的 函数 值 。 这 个 不 确定 的 
函数 6 仍 称 为 移动 函数 。 

k 带 非 确 定性 图 灵机 的 瞬 象 与 & 带 确 定性 图 灵机 的 瞬 象 一 样 定义 ,也 是 一 个 元 组 (a ， 
az ,s,Qk)。 其 中 ,a; 是 形 如 xqy 的 符号 串 。 设 非 确 定性 图 灵机 M=(Q,T,1,6,6,go ,dr) 正 
处 于 状态 g, 且 第 i 个 读 写 头 (1 二 i<) 正 扫描 着 第 i 条 带 上 有 符号 zx; 的 方 格 。 车 有 (7; (yi， 
Di),(y ,D2)2 (yi Di))E6(g;ziyX2 ;Xk); 则 说 表达 (gq;xzi ,zs，… ,xi) 的 瞬 象 ( 记 为 
B) 与 表达 (7; (yi ,Di),(y ,DC ,Di)) 产 生 的 瞬 象 ( 记 为 C) 之 间 有 关系 FOWD, 记 
为 B 上 CMDC( 在 不 引起 混淆 时 可 上 略 去 (MD))。 

如 果 对 于 每 一 个 输入 长 度 为 的 可 接受 输入 串 ,接受 该 输入 串 的 非 确定 性 图 灵机 M 的 计 
算 路 径 长 至 多 为 Tm) , 则 称 M 的 时 间 复 杂 性 是 T(n)。 如 果 有 某 个 导致 接受 状态 的 动作 序列 ， 
在 这 个 序列 中 ,每 一 条 带 上 至 多 扫描 了 SCz) 个 不 同 的 方 格 , 则 称 M 的 空间 复杂 性 为 S(n)。 

如 前 所 述 ,确定 性 和 非 确 定性 图 灵机 的 区 别 就 在 于 ,确定 性 图 灵机 的 每 一 步 只 有 一 种 选 
择 , 而 非 确定 性 图 灵机 却 可 以 有 多 种 选择 。 由 此 可 见 , 非 确定 性 图 灵机 的 计算 能 力 比 确定 性 
图 灵机 的 计算 能 力 强 得 多 。 对 于 一 台 时 间 复 杂 性 为 T(z) 的 非 确定 性 图 灵机 ,可 以 用 一 台 时 
间 复 杂 性 为 OCC™” ) 的 确定 性 图 灵机 模拟 ,其 中 C 为 一 常数 。 这 就 是 说 ,如 果 T(n) 是 一 个 
合理 的 时 间 复 杂 性 函数 ,M 是 一 台 时 间 复 杂 性 为 了 (z) 的 非 确定 性 图 灵机 ,可 以 找到 一 个 常 
数 C 和 一 台 确 定性 图 灵机 M“ ,使 得 它们 可 接受 的 语言 相同 , 且 M 的 时 间 复 杂 性 为 
OC™ )。 


8.1.2 PP 类 与 NP 类 语言 


下 面 定 义 两 个 重要 的 语言 类 PP 和 NP 如 下 : 

P= 二 {LIL 是 一 个 能 在 多 项 式 时 间 内 被 一 台 DTM 所 接受 的 语言 } 

NP 二 {LIL 是 一 个 能 在 多 项 式 时 间 内 被 一 台 NDTM 所 接受 的 语言 } 

由 于 一 台 确 定性 图 灵机 可 看 作 是 非 确定 性 图 灵机 的 特例 ,所 以 可 在 多 项 式 时 间 内 被 确 
定性 图 灵机 接受 的 语言 也 可 在 多 项 式 时 间 内 被 非 确定 性 图 灵机 接受 。 故 PENP。 

虽然 P 和 NP 是 借助 图 灵机 来 定义 的 ,但 也 可 以 用 其 他 计算 模型 定义 这 两 个 语言 类 。 
直观 上 ,可 以 认为 P 是 在 多 项 式 时 间 内 的 可 识别 的 语言 类 。 例 如 ,在 对 数 耗费 标准 下 ,如 果 
图 灵机 接受 语言 工 的 时 间 复 杂 性 为 了 (>z), 则 RAM 或 RASP 接受 语言 L 的 时 间 复 杂 性 介 
于 ATGOD 和 心 T(2) 之 间 , 其 中 ,A 和 心 都 是 正 的 常数 。 因 此 ,LEP 当 且 仅 当 在 RAM 或 
RASP 计算 模型 下 存在 接受 语言 工 的 多 项 式 时 间 算 法 。 

另 一 方面 , 若 在 RAM 或 RASP 的 指令 系统 上 添加 一 条 非 确定 性 选择 指令 
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CHOICECL ,Ls ,** ,Li) - 
也 可 以 定义 非 确定 性 的 RAM 或 RASP 计算 模型 。CHOICE 指令 非 确 定性 地 选 出 并 执行 二 


标号 为 Li ,Ls,… ,Li 之 一 的 语句 。 因 此 ,在 对 数 耗费 标准 下 ,也 可 以 用 非 确 定性 RAM 或 
RASP 模型 定义 NP 类 。 在 该 计算 模型 下 ,接受 语言 工 的 算法 称 为 非 确定 性 算法 。 一 个 非 
确定 性 算法 接受 语言 L, 当 且 仅 当 对 每 一 个 xzEL ,在 该 算法 中 存在 一 条 接受 xz 的 计算 路 径 。 
该 算法 的 计算 时 间 复 杂 性 T(n) 就 定义 为 .对 所 有 长 度 为 n 的 可 接受 输入 串 , 其 最 短 计算 路 
径 长 度 的 最 大 值 。 因 此 ,在 非 确 定性 RAM 或 RASP 计算 模型 下 ,NP 类 语言 可 定义 为 : 
NP=={L| 工 是 一 个 能 在 多 项 式 时 间 内 被 一 个 非 确 定性 RAM 或 RASP 下 算法 所 接受 
的 语言 } 
下 面 考查 NP 类 语言 的 一 个 例子 , 即 无 向 图 的 团 问题 。 该 问题 的 输入 是 一 个 有 个 顶 
点 的 无 向 图 G 二 (V,E) 和 一 个 整数 k。 要 求 判定 图 G 是 否 包 含 一 个 k 顶点 的 完全 子 图 
( 团 ) , 即 判 定 是 否 存在 VSV,|IV'|=k, 且 对 于 所 有 的 u,v€EV ,有 (u,v) EE。 
若 用 邻接 矩阵 表示 图 G, 用 二 进 制 串 表示 整数 &, 则 团 问 题 的 一 个 实例 可 以 用 长 度 为 
只 十 log& 十 1 的 二 进位 串 表示 。 因 此 , 团 问题 可 表示 为 语言 : 
CLIQUE=={w#v|lw,v€10,1)" ,以 w 为 邻接 矩阵 的 图 G 有 一 个 & 顶点 的 团 ,其 中 ,vw 
是 & 的 二 进 制 表示 。} 
接受 该 语言 CLIQUE 的 非 确定 性 算法 如 下 。 
用 非 确定 性 选择 指令 选 出 包含 & 个 顶点 的 候选 顶点 子 集 ,然后 确定 性 地 检查 该 子 集 
是 否 是 团 问题 的 一 个 解 。 算 法 分 为 3 个 阶段 。 
算法 的 第 一 阶段 将 输入 串 记 # 分解, 并 计算 出 n= VTzl ,以 及 用 表示 的 整数 上 。 若 
输入 不 具有 形式 包 ##v 或 |w| 不 是 一 个 平方 数 , 就 拒绝 该 输入 。 显 而 易 见 ,第 一 阶段 可 在 
O02 时间 内 完成 。 
在 算法 的 第 二 阶段 中 , 非 确定 性 地 选择 V 的 一 个 & 元 子 集 VSV。 用 向 量 A[1: 门 表示 
该 子 集 。A 中 恰 有 A 个 1, 即 A[ 门 =1 当 且 仅 当 i€V 。 非 确定 性 选择 算法 如 下 : 
int j=0; 
for (int ij 一 1;i< 一 nji 十 十 ) 
{ 
int m 一 choice(0,1); 
switch(m) 
{ 
case 0:a[i]=0; break; 
case 1:a[i]=1; j++; break; 
} 
} 
if (0j! 一 k) reject(); 
该 算法 产生 V 的 一 个 元 子 集 V'。 它 的 计算 时 间 显 然 为 O(n)。 因 此 ,算法 在 第 二 阶 
段 耗 时 O(n)。 
算法 的 第 三 阶段 是 确定 性 地 检查 V 的 团 性 质 。 若 V' 是 一 个 团 则 接受 输入 ,否则 拒绝 输 
入 。 这 显然 可 以 在 O(n*) 时 间 内 完成 。 因 此 ,整个 算法 的 时 间 复 杂 性 为 O(n) 。 
车 图 G 二 (V,E) 不 包含 一 个 k 团 . 则 在 算法 的 第 二 阶段 产生 的 任何 & 元 子 集 V' 不 具有 
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团 性 质 。 因 此 ,算法 没有 导致 接受 状态 的 计算 路 径 。 反 之 , 若 图 G 含有 一 个 团 V', 则 算法 
的 第 二 阶段 中 有 一 个 计算 路 径 产 生 V' ,使 得 在 算法 的 第 三 阶段 导致 接受 状态 。 
综 上 即 知 ,所 述 非 确定 性 算法 在 多 项 式 时 间 内 接受 语言 CLIQUE, 即 CLIQUEE NP。 


8.1.3 多 项 式 时 间 验 证 


在 识别 语言 CLIQUE 的 非 确定 性 算法 中 ,算法 第 二 阶段 是 非 确 定性 的 且 耗 时 OG)。 
整个 算法 的 计算 时 间 复 杂 性 主要 取决 于 第 三 阶段 的 验证 算法 , 即 给 定 了 图 G 的 一 个 & 团 猜 
测 “ ,验证 它 是 否 确 是 一 个 团 。 若 验证 部 分 可 在 多 项 式 时 间 内 完成 , 则 整个 非 确定 性 算法 
具有 多 项 式 时 间 复 杂 性 ,因而 所 识别 的 语言 为 NP 类 语言 。 这 是 识别 NP 类 语言 的 非 确定 
性 算法 所 具有 的 一 般 特 性 。 因 此 ,也 可 以 将 NP 类 语言 看 作 是 在 确定 性 计算 模型 下 多 项 式 
时 间 可 验证 的 语言 类 。 将 验证 算法 定义 为 两 个 自 变 量 的 算法 A, 其 中 ,一 个 自 变 量 是 通常 的 
输入 串 X, 另 一 个 自 变量 是 一 个 称 为 “证 书 ” 的 二 进 制 串 Y。 如 果 对 任意 串 XEL ,存在 一 个 
证 书 Y 并 且 A 可 以 用 Y 来 证 明 XEL, 则 算法 A 就 验证 了 语言 L。 例 如 ,在 团 问题 中 ,证 书 
是 图 G 中 一 个 k 团 , 它 提 供 了 足够 的 信息 供 算法 A( 第 三 阶段 的 算法 ) 在 多 项 式 时 间 内 验证 
语言 CLIQUE。 因 此 ,语言 CLIQUE 是 多 项 式 时 间 可 验证 语言 。 一 般 地 ,多 项 式 时 间 可 验 
证 语言 类 VP 可 定义 为 : 

VP 二 {LILE3" ,3 为 一 有 限 字符 集 ,存在 一 个 多 项 式 p 和 一 个 多 项 式 时 间 验 证 算法 
A(X,Y) 使 得 对 任意 XEZ* ,XEL 当 且 仅 当 存在 YE3* ,IY|<p(|X1) 有 A(X,Y)=1)。 

定理 8.1 VP=NP。 

证 明 : 先 证 明 VPSNP。 对 于 任意 LEVP, 设 p 是 一 个 多 项 式 且 A 是 一 个 多 项 式 时 间 
验证 算法 , 则 下 面 的 非 确 定性 算法 接受 语言 L。 

(1) 对 于 输入 XX, 非 确定 性 地 产生 一 字符 串 YES* 。 

(2) 当 A(X,Y)=1 时 ,接受 X。 

该 算法 的 步骤 (1) 与 团 问题 的 第 二 阶段 的 非 确 定性 算法 一 样 , 至 多 在 O(|X|) 时 间 内 完 
成 。 步 又 (2) 的 计算 时 间 是 |X| 和 |Y| 的 多 项 式 ,而 |Y| 三 p(|X1), 因 此 , 它 也 是 |X| 的 多 项 
式 。 整 个 算法 可 在 多 项 式 时 间 内 完成 。 因 此 ,LENP。 由 此 可 见 ,VPSNP。 

反之 , 设 LENP,LES* , 且 非 确定 性 图 灵机 M 在 多 项 式 时 间 p 内 接受 语言 L。 设 M 
在 任何 情况 下 只 有 不 超过 4 个 的 下 一 动作 选择 , 则 对 于 输入 串 X,M 的 任 一 动作 序列 可 用 
{0,1,…,d 一 1} 的 长 度 不 超过 如 (1X|) 的 字符 串 来 编码 。 不 失 一 般 性 , 设 | 之 | 这 d。 验 证 算 
法 4A(CX,Y) 用 于 验证 “Y 是 M 上 关于 输入 X 的 一 条 接受 计算 路 径 的 编码 ”。 即 当 Y 是 这 样 
一 个 编码 时 ,A(X,Y) 二 1。A(X,Y) 显 然 可 在 多 项 式 时 间 内 确定 性 地 进行 验证 , 且 

了 一 {X | 存在 Y 使 得 |Y|<p(| XI) 且 A(X,Y)=1) 

因此 ,LEVP。 由 此 可 知 ,VPSNP。 

综 上 即 知 ,VP==NP。 

例如 (哈密 顿 回 路 问题 ) : 一 个 无 向 图 G 含有 哈密 顿 回路 吗 ? 

无 向 图 G 的 哈密 顿 回 路 是 通过 G 的 每 个 顶点 恰好 一 次 的 简单 回路 。 可 用 语言 HAM 一 
CYCLE 定义 该 问题 如 下 : 

HAM 一 CYCLE 二 {G1G 含有 哈密 顿 回 路 } 
对 于 该 语言 的 输入 G 二 (V,E) 来 说 ,相应 的 “证 书 ” 就 是 G 的 一 条 哈密 顿 回路 。 算 法 A 
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要 验证 所 给 的 这 条 回路 确 是 G 所 包含 的 哈密 顿 回路 。 这 只 要 检查 所 提供 的 回路 是 否 是 
中 顶点 的 一 个 排列 且 沿 该 排列 的 每 条 连续 边 是 否 在 E 中 存在 。 这 样 就 可 以 验证 所 提供 的 
回路 是 否 是 G 的 哈密 顿 回路 。 该 验证 算法 显然 可 确定 性 地 在 O(n? ) 时 间 内 实现 ,其 中 ,n 是 
G 的 编码 长 度 。 因 此 ,HAM 一 CYCLEENP。 


8.2 NP 完全 问题 


从 了 类 和 NP 类 语言 的 定义 ,已 知道 PENP。 直 观 上 看 ,P 类 问题 是 确定 性 计算 模型 下 
的 易 解 问题 类 ,而 NP 类 问题 是 非 确 定性 计算 模型 下 的 易 验证 问题 类 。 在 通常 情况 下 , 解 一 
个 问题 要 比 验证 问题 的 一 个 解困 难得 多 ,特别 在 有 时 间 限 制 的 条 件 下 更 是 如 此 。 因 此 ,大 多 
数 的 计算 机 科学 家 认为 NP 类 中 包含 了 不 属于 了 类 的 语言 , 即 P 埃 NP。 但 这 个 问题 至 今 没 
有 获得 明确 的 解答 。 也 许 使 大 多 数 计算 机 科学 家 相信 P 取 NP 的 最 令 人 信服 的 理由 是 存在 
一 类 NP 完全 问题 。 这 类 问题 有 一 种 令 人 惊奇 的 性 质 , 即 如 果 一 个 NP 完全 问题 能 在 多 项 
式 时 间 内 得 到 解决 ,那么 NP 中 的 每 一 个 问题 都 可 以 在 多 项 式 时 间 内 求解 , 即 P= 二 NP。 尽 
管 已 进行 多 年 研究 ,目前 还 没有 一 个 NP 完全 问题 有 多 项 式 时 间 算 法 。 


8.2.1 多 项 式 时 间 变 换 


前 面 已 讨论 过 问题 变换 的 概念 。 对 于 语言 来 说 ,变换 的 概念 也 是 一 样 的 。 

设 L 导 37 ,LS 是 2 个 语言 。 所 谓语 言 Li 能 在 多 项 式 时 间 内 变换 为 语言 L,( 简 记 
为 Li,L:) 是 指 存在 映射 f: 57 一 32 , 且 了 满足 : 

(1) 有 一 个 计算 f 的 多 项 式 时 间 确 定性 图 灵机 。 

(2) 对 于 所 有 xzEB? ,zxELi, 当 且 仅 当 f(x) EL,。 

定义 : 语言 L 是 NP 完全 的 当 且 仅 当 

(1) LENP., 

(2) 对 于 所 有 L'ENP 有 Lc,L。 

如 果 有 一 个 语言 工 满足 上 述 性 质 (2) ,但 不 一 定 满足 性 质 (1), 则 称 该 语言 是 NP 难 的 。 
所 有 NP 完全 语言 构成 的 语言 类 称 为 NP 完全 语言 类 , 记 为 NPC。 

由 NPC 类 语言 的 定义 可 以 看 出 它们 是 NP 类 中 最 难 的 问题 ,也 是 研究 P 类 与 NP 类 的 
关系 的 核心 所 在 。 

定理 8.2 设 L 是 NP 完全 的 , 则 

(1) LEP 当 且 仅 当 P=NP。 

(2) 车 LocsL1, 且 Li1ENP, 则 Li 是 NP 完全 的 。 

证 明 : (1) 若 P=NP, 则 显然 LEP。 反 之 , 设 LEP, 而 LiENP。 则 工 可 在 多 项 式 时 间 
i 内 被 确定 性 图 灵机 M 所 接受 。 又 由 工 的 NP 完全 性 知 L1cc@L , 即 存在 映射 f, 使 L= 
Py 

设 N 是 在 多 项 式 时 间 p, 内 计算 三 的 确定 性 图 灵机 。 用 图 灵机 M 和 N 构造 识别 语言 
Li 的 算法 A 如下。 

Q@ 对 于 输入 xz, 用 NN 在 ps(|z|) 时 间 内 计算 出 f(x)。 

@ 在 时 间 |f(z)| 内 将 读 写 头 移 到 f(z) 的 第 一 个 符号 处 。 


Co 
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@ 用 MM 在 时 间 pi(flzx|) 内 判定 f(x)EL。 车 f(z) EL, 则 接受 zz, 否 则 拒绝 zx。 

上 述 算法 显然 可 接受 语言 Li ,其 计算 时 间 为 pp(|z1) 十 |f(z)| 十 pi1 (flz|)。 由 于 图 灵 
机 一 次 只 能 在 一 个 方 格 中 写 人 一 个 符号 , 故 |FGz)| 委 1zl 十 加 (lzl)。 因 此 ,存在 多 项 式 ~ 
使 得 ps(|z|) 十 | f(z) | 十 pi (flzx1) 二 r(x)。 因 此 ,Li1 EP。 由 工 的 任意 性 即 知 P=NP。 

(2) 只 要 证 明 对 任意 的 L'ENP, 有 LsL1。 由 于 L 是 NP 完全 的 , 故 存在 多 项 式 时 间 
变换 f 使 L 二 =f(L')。 又 由 于 LsL1, 故 存在 一 多 项 式 时 间 变 换 g 使 L, 一 g(L)。 因 此 ,车 
取 f 和 g 的 和 复合 函数 Ah 二 g( 有 ), 则 上 L 二 h(L')。 易 知 有 hh 为 一 多 项 式 。 因此,L'cc,L1。 由 
LL' 的 任意 性 即 知 ,Li € NPC。 

从 定理 8.2 的 (1) 可 知 ,如果 任 一 NP 完全 问题 可 在 多 项 式 时 间 内 求解 , 则 所 有 NP 中 
的 问题 都 可 在 多 项 式 时 间 内 求解 。 反 之 , 若 P 取 NP, 则 所 有 NP 完全 问题 都 不 可 能 在 多 项 
式 时 间 内 求解 。 

定理 8. 2 的 (2) 实 际 上 是 证 明 问 题 的 NP 完全 性 的 有 力 工 具 。 一 旦 建立 了 问题 L 的 NP 
完全 性 后 ,对 于 Li € NP, 只 要 证 明 问 题 L 可 在 多 项 式 时 间 内 变换 为 Li, 即 Loc,Li ,就 可 证 
明 Li 也 是 NP 完全 的 。 


8.2.2 Cook 定理 


定理 8.2 所 提供 的 证 明 问 题 的 NP 完全 性 的 方法 只 有 在 有 了 第 一 个 NP 完全 问题 之 后 
才能 使 用 。 获 得 “第 一 个 NP 完全 问题 "称号 的 是 布尔 表达 式 的 可 满足 性 问题 。 这 就 是 著名 
的 Cook 定理 。 

定理 8.3(Cook 定理 ) 布尔 表达 式 的 可 满足 性 问题 SAT 是 NP 完全 的 。 

证 明 : SAT 的 一 个 实例 是 个 布尔 变量 xz; ,zz ,ze 的 za 个 布尔 表达 式 Al,A ,…， 
A,。 若 存在 各 布尔 变量 x;(1 三 ik) 的 0,1 赋值 ,使 每 个 布尔 表达 式 A; (1 三 i 三 mm) 都 取 值 
1, 则 称 布尔 表达 式 A,A:…A,。 是 可 满足 的 。 

SATE NP 是 很 明显 的 。 对 于 任 给 的 布尔 变量 zi ,zs，… ,zs 的 0,1 赋值 ,容易 在 多 项 
式 时 间 内 验证 相应 的 A1A。…A。 的 取 值 是 否 为 1。 因 此 ,SATE NP。 

现在 只 要 证 明 对 任意 的 LENP 有 Lecc,SAT 即 可 。 设 M 是 一 台 能 在 多 项 式 时 间 内 识 
别 工 的 非 确定 性 图 灵机 ,而 W 是 对 M 的 一 个 输入 。 由 M 和 W 能 在 多 项 式 时 间 内 构造 一 
个 布尔 表达 式 Wo ,使 得 Wo。 是 可 满足 的 当 且 仅 当 M 接受 W。 

不 难 证 明 , 属 于 NP 的 任何 语言 能 由 一 台 单 带 的 非 确定 性 图 灵机 在 多 项 式 时 间 内 识别 。 
因此 ,不 妨 假定 M 是 一 台 单 带 图 灵机 。 设 M 有 ;个 状态 go ,gj ,…:,q ,和 浆 个 带 符号 Xi ， 
Xs，…, 义 。。P(n) 是 M 的 时 间 复 杂 性 。 

设 W 是 M 的 一 个 长 度 为 ”的 输入 。 若 M 接受 W, 只 需要 不 多 于 P(n) 次 移动 。 也 就 
是 说 ,存在 M 的 一 个 瞬 象 序列 QQ,…,Q,, 使 Qi 上 FQ;(1 志 i<r)。 其 中 ,Q 是 初始 瞬 象 ， 
Q. 是 接受 瞬 象 ,r 过 Pl(n)。 由 于 读 写 头 每 次 最 多 移动 一 格 , 因 此 任 一 接受 W 的 瞬 象 序列 不 
会 使 用 多 于 已 CO) 个 方 格 。 不 失 一 般 性 可 假定 M 到 达 接 受 状态 后 将 继续 运行 下 去 ,但 以 后 
的 “计算 ”将 不 移动 读 写 头 ,也 不 改变 已 进入 的 接受 状态 ,直到 P(x) 个 动作 为 止 。 也 就 是 说 ， 
用 一 些 空 动作 填补 计算 路 径 , 使 它 的 长 为 P(n), 即 恒 有 r=P(n)。 

判断 Q ,Qi ,…,Qro 为 一 条 接受 W 的 计算 路 径 等 价 于 判断 下 述 7 条 事实 。 

(1) 在 每 一 瞬 象 中 读 写 头 恰 只 扫描 一 个 方 格 。 
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(2) 在 每 一 瞬 象 中 ,每 个 方 格 中 的 带 符号 是 唯一 确定 的 。 和 
(3) 在 每 一 瞬 象 中 恰 有 一 个 状态 。 章 


(4) 在 该 计算 路 径 中 ,从 一 个 瞬 象 到 下 一 个 瞬 象 每 次 最 多 有 一 个 方 格 (被 读 写 头 扫描 着 
的 那个 方 格 ) 的 符号 被 修改 。 

(5) 相继 的 瞬 象 之 间 是 根据 移动 函数 6 来 改变 状态 , 读 写 头 位 置 和 方 格 中 符号 的 。 

(6) Qu 是 M 在 输入 W 时 的 初始 瞬 象 。 

(7) 最 后 一 个 瞬 象 Qeo 中 的 状态 是 接受 状态 。 

证 明 的 思路 是 构造 一 个 布尔 表达 式 Wo ,用 它 “ 模 拟 ”" 由 M 所 能 接受 的 瞬 象 序列 ,使 得 对 
Wo 中 各 变量 的 一 组 0,1 赋值 最 多 表示 M 中 的 一 个 瞬 象 序列 (也 可 能 有 的 不 表示 M 的 一 个 
合法 的 瞬 象 序列 )。 布 尔 表达 式 W。 取 值 1 当 且 仅 当 赋予 变量 值 后 ,对 应 着 一 个 导向 可 接受 
的 瞬 象 序列 Qu ,Qi ,…',Qee 。 因 此 ,Wo 可 满足 当 且 仅 当 M 接受 W。 

为 了 确切 地 表达 上 述 7 条 事实 ,需要 引进 和 使 用 以 下 几 种 命题 变量 。 

(1) C(i,j,t) 二 1, 当 且 仅 当 在 时 刻 1,M 的 输入 带 的 第 i 个 方 格 中 的 带 符号 为 X; ,其 中 ， 
1<i<P(n) ,1<j<m,0<t<P(n)., 

(2) SCk,t) 二 1, 当 且 仅 当 在 时 刻 1,M 的 状态 为 qi ,其 中 ,1<k 志 ,0<1P(n)。 

(3) 甩 (i,1t)= 二 1, 当 且 仅 当 在 时 刻 t, 读 写 头 扫描 第 i 个 方 格 ,其 中 ,1 二 i< 
P(n) .0<t<P(n), 

这 里 总 共 最 多 有 OCP?(n)) 个 变量 ,它们 可 以 由 长 不 超过 clogn 的 二 进 制 数 表示 ,其 中 ， 
c 是 依赖 于 P 的 一 个 常数 。 为 了 叙述 方便 ,假定 每 个 变量 仍 表示 为 单个 符号 而 不 是 clogn 
个 符号 。 这 样 做 将 少 了 一 个 因子 clogn, 但 这 并 不 影响 对 问题 的 讨论 。 

现在 可 以 用 上 面 定 义 的 这 些 变 量 , 通 过 模拟 瞬 象 序列 Qi ,Qi ,…',Qeo 构造 布尔 表达 式 
W。。 在 构造 时 还 要 用 到 一 个 谓词 UCz ,xs，,…,zx,)。 当 且 仅 当 各 变量 zz ,…,z 中 只 有 一 
个 变量 取 值 1 时 ,谓词 U(x ,zs，,…,z,) 才 取 值 1。 因 此 ,U 的 布尔 表达 式 可 以 写成 如 下 形式 ， 

U(Czl,ze，…zr) 一 (zl 十 Za +z) I 二 


上 式 的 第 一 个 因子 断言 至 少 有 一 个 x; 取 值 1, 而 后 面 的 r(x 一 1)/2 个 因子 断言 没有 2 
个 变量 同时 取 值 1。 注意 ,U 的 长 度 是 O()( 严 格 地 说 ,一 个 变量 至 多 用 clogn 个 二 进 制 位 
表示 , 故 U 长 度 至 多 为 O(r?logn))。 
现在 构造 与 判断 (1) 到 (7) 相 应 的 布尔 表达 式 A,B.C.D,E,F,G。 
(1) A 断言 在 M 的 每 一 个 时 间 单 位 中 , 读 写 头 恰 好 扫描 着 一 个 方 格 。 设 A, 表示 在 时 
刻 t 时 M 的 读 写 头 恰 好 扫描 着 一 个 方 格 , 则 
A= AoAl Ap 
其 中 ， 
A, =UCH(Lt, 百 (2.0 ,HPGOD),t), 0 二 ti 二 POD) 
注意 ,由 于 用 一 个 符号 表示 一 个 命题 变量 百人 it , 故 A 的 长 为 O(P3(n)), 而 且 可 以 用 
一 台 确 定性 图 灵机 在 OCP?(z)) 时 间 内 写 出 这 个 表达 式 。 
(2) B 断言 在 每 一 个 单位 时 间 内 ,每 一 个 带 方 格 中 只 有 一 个 带 符号 。 设 Bi 表示 在 时 +， 
第 i 个 方 格 中 只 含有 一 个 带 符号 , 则 
二 三 ., 奸 坊 


0SitSP 


算法 设计 与 分 折 ( 艇 工厂 ) 


其 中 ， 
Bi = UCCCi,1 st) Chi,2,0) ,Cismt)) ,0 Cit < Pn) 
由 于 m 是 M 的 带 符号 集中 带 符号 数 , 故 B; 的 长 度 与 n 无 关 。 因 而 B 的 长 度 是 
OCP?(n)), 
(3) C 断言 在 每 个 时 刻 t+,M 只 有 一 个 确定 的 状态 , 则 
c= I UCS(0,2) ,S(t) ,SCs —1,)) 


0<t<P) 
因为 ;是 M 的 状态 数 , 它 是 一 个 常数 ,所 以 C 的 长 度 为 OC(P(n))。 
(4) D 断言 在 时 刻 t 最 多 只 有 一 个 方 格 的 内 容 被 修改 , 则 


D= [[ (edi,sjst) eisjyt+1) + H(i,t)) 


这 里 xz 三 y 是 zy 十 zy 的 缩写 ,表示 xz 当 且 仅 当 y。 

表达 式 (C(i,j,t) 夺 Cli,j,t 十 1) 十 H(i,t)) 断 言 下 面 的 二 者 之 一 : 

Q@ 在 时 刻 t 读 写 头 扫描 着 第 i 个 方 格 。 

@ 在 时 刻 t 十 1, 第 i 个 方 格 中 的 符号 仍 是 时 刻 t 的 符号 Xi 。 

因为 A 和 B 断言 在 时 刻 t 读 写 头 只 能 扫描 着 一 个 带 方 格 和 方 格 ; 上 仅 有 一 个 符号 ,所 
以 在 时 刻 +, 或 者 读 写 头 扫描 着 方 格 i( 这 里 的 符号 可 能 被 修改 ) ,或 者 方 格 i 的 符号 不 变 。 即 
使 不 使 用 缩写 “三 ”, 表 达 式 D 的 长 度 也 是 OCP?(n))。 

(5) EE 断言 根据 M 的 移动 函数 8, 可 以 从 一 个 瞬 象 转向 下 一 个 瞬 象 。 设 Ei 表示 下 列 4 
种 情形 之 一 : 

Q@ 在 时 刻 : 第 ; 个 方 格 中 的 符号 不 是 X， 。 

@ 在 时 刻 t 读 写 头 没有 扫描 着 方 格 i。 

@ 在 时 刻 t,M 的 状态 不 是 gq。 

@ M 的 下 一 瞬 象 是 根据 移动 函数 从 上 一 瞬 象 得 到 的 。 

由 此 可 得 已 = J Ea 。 其 中 ， 

Eo =—C(i,j,t) + H(i,t) 十 一 St 
+ DCOisjitt+1)Sk t+ 1 Hit 1)) 


上 式 中 ,/ 遍 取 当 MM 处 于 状态 gi 且 扫 描 X;) 时 所 有 可 能 的 移动 , 即 ! 取 遍 使 得 (qu ,Xi ,dz)E 
6(qi，X;) 的 一 切 值 。 

因为 M 是 非 确定 性 图 灵机 ,(g,X,d) 的 个 数 可 能 不 止 一 个 。 但 在 任何 情况 下 ,都 只 能 
有 有 限 个 , 且 不 超过 某 一 常数 。 故 Es 的 长 度 与 无关。 所 以 ,EE 的 长 度 是 OCP?(n))。 

(6) 下 断言 满足 初始 条 件 , 即 


F= S(1,0)H(1,0) [[ Ciyji,0 TI Cdi,1,0) 


1<i<n n<i<P(n) 


其 中 ,S(1,0) 断 言 在 时 刻 + 二 0,M 处 于 初始 状态 g。。H(1,0) 断 言 在 时 刻 + 二 0,M 的 读 写 头 
扫描 着 最 左边 的 带 方 格 。]] C(i,j;.0) 断言 在 时 刻 t+ 二 0, 带 上 最 前 面 的 个 方 格 中 放 有 串 


1<i<n 


WW 的 nn 个 符号 ,而 [| C4i,1,0) 断言 带 上 其 余 方 格 中 开始 都 是 空白 符 , 这 里 不 妨 假定 Xi 


n<i<P) 


就 是 空白 符 。 显 然 ,F 的 长 度 是 O(P(n))。 
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(7) G 断言 M 最 终 将 进入 接受 状态 。 因 为 已 对 M 做 了 修改 ,一 旦 M 在 某 个 时 刻 t 进 
人 接受 状态 (1 二 1 二 P(n)), 它 将 始终 停 在 这 个 状态 ,所 以 有 G 二 S(s 一 1,P(n))。 不 妨 取 gq,-1 
为 M 的 接受 状态 。 

最 后 , 令 W。 一 ABCDEFG。 它 就 是 所 要 构造 的 布尔 表达 式 。 给 定 可 接受 的 瞬 象 序列 
Qu ,Qi1,…,Q,, 显 然 可 找到 变量 Cli,j,t) ,Slk,t) 和 昌 (i,t) 的 某 个 0,1 赋值 ,使 W。 取 值 1。 
反之 ,车 有 一 个 使 Wo。 被 满足 的 赋值 , 则 可 根据 其 变量 赋值 相应 地 找到 可 接受 计算 路 径 Q,， 
Qi,…,Q,。 因 此 ,Wo 是 可 满足 的 当 且 仅 当 M 接受 W。 

因为 W。 的 每 一 个 因子 最 多 需要 OCP3(n)) 个 符号 , 它 一 共有 7 个 因子 ,从 而 Wo 的 符号 
长 度 是 O(Ps(n))。 即 使 用 长 度 为 O(logn) 的 符号 串 取代 描述 各 个 变量 的 简单 符号 ,Wo 的 
长 度 也 不 过 是 OCP3(n)logn)。 也 就 是 说 ,存在 一 个 常数 c,W。 的 长 度 不 超过 czPs(z) ,这 仍 
是 一 个 多 项 式 。 

上 述 构 造 中 并 没有 对 语言 L 加 任何 限制 。 也 就 是 说 ,对 属于 NP 的 任何 语言 ,都 能 在 多 
项 式 时 间 内 将 其 变换 为 布尔 表达 式 的 可 满足 性 问题 SAT。 因 此 ,SAT 是 NP 完全 的 , 即 
SATENPC。 


8.3 一 些 典型 的 NP 完全 问题 


Cook 定理 的 重要 性 是 明显 的 , 它 给 出 了 第 一 个 NP 完全 问题 。 使 得 对 于 任何 问题 Q， 
只 要 能 证 明 QE NP 且 SATec,Q , 便 有 QENPC。 所 以 ,人 们 很 快 就 证 明了 许多 其 他 问题 的 
NP 完全 性 。 这 些 NP 完全 问题 都 是 直接 或 间接 地 以 SAT 的 NP 完全 性 为 基础 而 得 到 证 明 
的 。 由 此 逐渐 生长 出 一 棵 以 SAT 为 树 根 的 NP 完全 问题 树 。 图 8-1 是 这 棵 树 的 一 小 部 分 。 
其 中 每 个 结 点 代表 一 个 NP 完全 问题 ,该 问题 可 在 多 项 式 时 间 内 变换 为 它 的 任 一 儿子 结 点 
表示 的 问题 。 实 际 上 ,由 树 的 连通 性 及 多 项 式 在 复合 变换 下 的 封闭 性 可 知 ,NP 完全 问题 树 
中 任 一 结 点 表示 的 问题 可 以 在 多 项 式 时 间 内 变换 为 它 的 任 一 后 裔 结 点 表示 的 问题 。 目 前 这 
棵 NP 完全 问题 树 上 已 有 几 千 个 结 点 ,并 且 还 在 继续 生长 。 


SAT 


HAM-CYCLE 


图 8-1 部 分 NP 完全 问题 树 


Oo 
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下 面 介绍 这 棵 NP 完全 树 中 的 几 个 典型 的 NP 完全 问题 。 
8.3.1 合 取 范式 的 可 满足 性 问题 


给 定 一 个 合 取 范式 ,判定 它 是 否 可 满足 。 

如 果 一 个 布尔 表达 式 是 一 些 因子 和 之 积 , 则 称 之 为 合 取 范式 ,简称 CNF (conjunctive 
normal form)。 这 里 的 因子 是 变量 或 x。 例如 , (zi 十 x2) (zz 十 ZX3) (Zz1 十 zz 十 xz) 就 是 一 
个 合 取 范式 ,而 zizs 十 zs 就 不 是 合 取 范 式 。 

要 证 明 CNF-SATENPC, 只 要 证 明 在 Cook 定理 中 定义 的 布尔 表达 式 A,B,…,G 或 者 
已 是 合 取 范式 ,或 者 有 的 虽然 不 是 合 取 范式 ,但 可 以 用 布尔 代数 中 的 变换 方法 将 它们 化 成 合 
取 范 式 , 而 且 合 取 范式 的 长 度 与 原 表达 式 的 长 度 只 差 一 个 常数 因子 。 注 意 到 在 Cook 定理 
的 证 明 中 引入 的 谓词 U(zi ,zs,…,z,) 已 经 是 一 个 合 取 范式 ,从 而 A,B,C 都 是 合 取 范 式 。 
下 和 G 都 是 简单 因子 的 积 ,因而 也 都 是 合 取 范式 。 

DD 是 形 如 (zx 寺 y) 十 z 的 表达 式 的 积 。 如 果 以 zy 十 zy 替换 z+ 三 y, 可 将 (x 三 y) 十 z 改写 
为 zy 十 Zy 十 z, 这 等 价 于 (xz 十 y 十 x)(z 十 y 十 z)。 因 此 ,D 可 变换 为 与 之 等 价 的 合 取 范 式 , 且 
其 表达 式 的 长 最 多 是 原 式 长 度 的 2 倍 。 

最 后 ,由 于 表达 式 E 是 Ew 的 积 ,每 个 Ej 的 长 度 与 n 无关, 将 Ei 变换 成 合 取 范式 后 
长 度 也 与 无关。 因此 ,将 EF 变换 成 合 取 范式 后 ,其 长 度 与 原 长 最 多 差 一 个 常数 因子 。 

由 此 可 见 , 将 布尔 表达 式 W。 变 换 成 与 之 等 价 的 合 取 范 式 后 ,其 长 度 只 相差 一 个 常数 因 
子 。 因 此 ,CNF-SATE NPC。 

如 果 一 个 布尔 合 取 范式 的 每 个 乘积 项 最 多 是 个 因子 的 析 取 式 , 就 称 之 为 元 合 取 范 
式 , 简 记 为 k-CNF。 一 个 k-SAT 问题 是 判定 一 个 k-CNF 是 否 可 满足 。 特 别 地 , 当 &=3 时 ， 
3-SAT 问题 在 NP 完全 问题 树 中 具有 重要 地 位 。 


8.3.2 3 元 合 取 范式 的 可 满足 性 问题 


给 定 一 个 3 元 合 取 范式 ,判定 它 是 否 可 满足 。 

3-SATE NP 是 显而易见 的 。 为 了 证 明 3-SATE NPC, 只 要 证 明 CNF-SATcc,3-SAT， 
ie ii yt 3-SAT。 

给 定 一 个 合 取 范 式 ,其 中 每 一 个 合 取 项 具有 形式 (zj 十 zz 十 … 十 ze) 。 

考虑 a 的 合 取 项 (zx es :十 zi) ,将 其 变换 为 一 个 3 元 合 取 范式 如 下 。 

添加 个 新 变量 y1 ,ys，… ,yi, 并 考虑 3 元 合 取 范式 

= (zi 二 yDC9i 十 Tz 十 Ya) (yi 十 Ti 十 y4) 

对 于 zi ,zs，… ,zx 的 任 一 0,1 赋值 ,存在 新 变量 wm ,ys，… ,ys 的 相应 的 0,1 赋值 ,使 得 
(zi 十 zs 十 … 十 x) 二 1 当 且 仅 当 a=1。 

事实 上 ,车 (十 zz 十 … 十 x) 二 1, 则 至 少 有 一 个 x; 取 值 1。 令 和 一 min 人 il 一 
1,1<i<k}.。 

当 j<i 时 , 令 yj 二 0, 当 ji 时 令 yj 二 1。 按 此 zx; 和 y; 的 0,1 赋值 ,容易 验证 a 二 1。 反 
之 , 若 有 Zz; 和 y; 的 0,1 赋值 使 < 二 1, 则 zx; ,1 二 i<k 中 至 少 有 一 个 变量 取 值 1。 因 若 不 然 ,zx; 一 
0,1 二 ikR。 由 a 二 1 推 知 zi 十 yi 二 1, 由 此 得 yx, 二 0, 又 由 wi 十 zz 十 ys 二 1 推 知 y, 二 0, 类 似 地 还 
有 ys 一 0,… ,yi 一 0。 而 由 a 二 1 又 可 推 知 ys 二 1, 此 为 矛盾 。 故 zi 十 zz 十 … 十 zx 二 1。 


UVP 完 会 性 理论 与 近似 算法 


由 上 面 的 分 析 即 知 , 任 给 一 个 合 取 范式 a, 都 可 以 将 其 变换 为 一 个 3 元 合 取 范式 B, 使 得 
a 是 可 满足 的 当 且 仅 当 B 是 可 满足 的 ,而 且 能 够 在 正比 于 a 的 长 度 的 时 间 内 构造 8。 也 就 是 
说 ,CNF-SATcc,3-SAT。 从 而 3-SATE NPC。 

3 元 合 取 范 式 的 一 个 稍 不 同 的 定义 是 ,每 个 合 取 项 恰 为 3 个 因子 的 和 。 若 采用 这 种 定 
义 , 仍 有 3-SATENPC。 事 实 上 ,对 于 只 有 2 个 因子 的 合 取 项 z 十 y, 可 引入 新 变量 c, 并 构造 
(Zz 十 y 十 c)(Cz 十 y 十 c) 替 换 合 取 项 xz 十 y。 容 易 证 明 ,zx 十 y 二 1 当 且 仅 当 (x 十 y 十 中) (x 十 y 十 
c) 王 1。 对 于 只 有 一 个 因子 的 合 取 项 zx, 可 引入 新 变量 c 和 4d, 并 构造 (zx 十 c 十 d) (x 十 c 十 d) 
(zx 十 c 十 d) (zx 十 c 十 4d) 替 换 合 取 项 zx, 将 其 变换 为 惟有 3 个 因子 的 合 取 项 。 容 易 证 明 ,x=1 
当 上 且 仅 当 (zx 十 c 十 d) (zx 十 c 十 d) (xz 十 c 十 qd) (z 十 c 十 d)= 二 1。 这 些 变换 显然 可 在 多 项 式 时 间 内 
完成 。 由 此 即 知 ,在 3 元 合 取 范式 的 这 种 不 同 的 定义 下 仍 有 3-SATE NPC。 


8.3.3 团 问 题 


给 定 一 个 无 向 图 G==(V,E) 和 一 个 正 整 数 &, 判 定 图 G 是 否 包含 一 个 & 团 , 即 是 否 存 在 
VSEV,IV'|=k, 且 对 任意 u,wEV 有 (wu,w)EE。 

已 经 知道 CLIQUEE NP。 下 面 通过 3-SAToc,CLIQUE 来 证 明 CLIQUE 是 NP 难 的 ， 
从 而 证 明 团 问 题 是 NP 完全 的 。 

设 9=C1Cs…Cs 是 一 个 3 元 合 取 范式 。 其 中 C,== 如 十 必 十 5 ,r= 二 1,2,…,k。 

据 此 ,构造 一 个 图 G, 使 得 9 是 可 满足 的 当 且 仅 当 图 G 有 一 个 & 团 。 

对 于 9 中 每 个 合 取 式 C,=Wi 十 十 85 定义 图 G 中 与 1 ,如 十 45 对 应 的 3 个 顶点 vi ,vi， 


好。 约定 顶点 wi 的 编号 为 3(r 一 1) 十 i,1 志 i 三 3,1 志 rk。 顶 点 集 V 中 共有 3k 个 顶点 , 编 
号 依次 为 1,2,…,3&k。 当 G 中 的 顶点 zf 和 wj 满足 下 面 2 个 条 件 时 ,建立 连接 这 2 个 顶点 的 
边 (vi,v)EE。 


(1) 天 >, 即 过 和 过 分 别 在 不 同 的 合 取 式 中 。 
(2) 不 是 4 的 非 , 即 4 冯 4;。 
图 G 显 然 可 在 多 项 式 时 间 内 构造 出 来 。 例 如 , 当 
0= (zi 二 zz 二 Zz3) (zi 二 Zz 二 x3) (zi 二 zz 十 3) 
时 构造 出 与 之 相应 的 图 G, 如 图 8-2 所 示 。 


图 8-2 与 9 相对 应 的 图 G 


对 于 这 样 构造 出 来 的 图 G, 可 以 证 明 0 是 可 满足 的 当 且 仅 当 G 有 一 个 & 团 。 事实 上 ,车 
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0 一 1, 则 C= 十 如 十 8 二 1,1 全 rR。 由 此 知 11 ,ls ,23 中 至 少 有 一 个 因子 取 值 1,1 委 ~ 入 &。 
将 每 个 C, 中 取 值 为 1 的 一 个 因子 对 应 的 V 中 顶点 取出 并 放 入 项 点 集 W , 共 取 出 & 个 顶点 ， 
故 |V'|=k, 且 V' 为 G 的 & 团 。 因 为 V' 中 任意 2 个 顶点 vi,v;EV, 有 r 关 s, 且 V7 和 7; 均 取 值 
1, 故 它们 不 是 互补 变量 。 由 G 的 构造 法 则 即 知 (vi ,v;) EE。 

反之 ,车 G 有 一 k 团 V'。 由 G 的 构造 可 知 ,对 任意 1 三 rk,vi, 世 ,vi 之 间 没 有 边 相 
连 。 因 此 ,V 中 个 顶点 分 别 对 应 于 C, 中 一 个 因子 ,1 硅 r<k。 因 为 互补 变量 之 间 没 有 边 相 
连 ,不 会 产生 矛盾 的 情况 。 其 他 变量 的 取 值 只 要 满足 一 致 性 即 可 。 因 此 ,每 个 C, 中 有 一 个 
因子 取 值 1,1 志 rk, 从 而 0 王 1。 因 此 ,0 是 可 满足 的 。 

综 上 即 知 ,CLIQUE 是 NP 难 的 ,从 而 CLIQUEE NPC。 


8.3.4 顶点 覆盖 问题 
给 定 一 个 无 向 图 G=(V,E) 和 一 个 正 整数 人 ,判定 是 否 存在 VSEV,|V | 一 &, 使 得 对 于 
任意 (u,v)EE 有 uwuEV' 或 vuEV 。 如 果 存 在 这 样 的 V' ,就 称 V' 为 图 G 的 一 个 大 小 为 k 顶 


点 覆盖 。 
例如 ,图 8-3(b) 中 的 图 有 一 个 大 小 为 2 的 顶点 覆盖 {ww,z)。 


(a) (b) 
图 8-3 G 及 其 补 图 


顶点 覆盖 问题 原来 是 以 找 图 G 的 最 小 顶点 覆盖 的 形式 提出 的 。 为 了 研究 其 计算 复杂 
性 ,将 它 表 述 为 相应 的 判定 问题 。 

首先 容易 看 出 ,VERTEX-COVERENP。 因 为 对 于 给 定 的 图 G 和 正 整数 & 以 及 一 个 
“证 书 ”V ,验证 |V | 二, 然后 对 每 条 边 (u,v) EE, 检 查 是 否 有 u€EV 或 EV' ,显然 可 在 多 
项 式 时 间 内 完成 。 

下 面 通过 CLIQUEcc, VERTEX-COVER 来 证 明 顶 点 覆盖 问题 是 NP 难 的 。 这 一 变换 
是 以 图 G 的 “ 补 图 ”概念 为 基础 的 。 给 定 无 向 图 G 二 (V,E) ,其 补 图 G 定义 为 G 二 (V,E), 其 
中 ,EE 二 {(u,v)| (u,v) 针 E}。 换 句 话说 ,G 是 包含 了 不 在 G 中 的 那些 边 的 图 。 图 8-3 是 一 个 
图 及 其 补 图 的 示意 图 。 

由 团 问题 的 一 个 实例 (G,k) ,可 以 在 多 项 式 时 间 内 构造 出 G 的 补 图 G。 从 而 得 到 顶点 
覆盖 问题 的 一 个 实例 (G,1V| 一 k)。 可 以 证 明 图 G 有 一 个 k 团 当 且 仅 当 G 有 一 个 大 小 为 
IV1 一 & 的 项 点 覆盖 。 

事实 上 ,车 G 有 一 个 k 团 V',IV'|=k, 则 V 一 V' 是 G 的 一 个 大 小 为 |V| 一 k 的 顶点 覆 
闵 。 设 (u,v) 是 EE 中 任意 一 边 , 则 (u,v) FE。 由 团 的 性 质 即 知 ,wx 和 w 中 至 少 有 一 个 顶点 不 
属于 V 。 也 就 是 说 ,wx 和 w 中 至 少 有 一 个 顶点 属于 V 一 V , 即 边 (u,v) 被 V 一 V "覆盖 。 由 (u， 
v) EE 的 任意 性 即 知 EE 被 V 一 V' 覆 盖 。 因 此 ,V 一 V' 是 G 的 一 个 大 小 为 |V| 一 & 的 顶点 
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覆盖 。 
反之 , 设 G 有 一 顶点 覆盖 V'SV, 且 |V'|==|V| 一 k&。 对 任意 u,vEV ,车 (u,v)EE, 则 色 
和 中 至 少 有 一 个 顶点 属于 V 。 这 等 价 于 ,对 任意 的 u,v€EV, 若 uFV 且 v&V, 则 
(u,v) EE。 换 句 话 说 ,V 一 V' 是 G 的 一 个 团 ,其 大 小 为 IV1 一 |V'1=k, 即 V 一 V' 是 G 的 一 个 
上 团 。 

因此 ,CLIQUEcc,VERTEX-COVER ,从 而 VERTEX-COVERE NPC。 


8.3.5 子 集 和 问题 


给 定 整数 集合 S 和 一 个 整数 上 ,判定 是 否 存在 S 的 一 个 子 集 S' 夺 S$, 使 得 S 中 整数 的 和 
为 1。 

例如 ,车 S= {1,4,16,64,256,1040, 1041, 1093, 1284, 1344} 且 t= 3754, 则 子 集 
S' 二 {1,16,64,256,1040,1093,1284}) 是 一 个 解 。 


对 于 子 集 和 问题 的 一 个 实例 (S,t) ,给 定 一 个 “证 书 ”S', 要 验证 :二 》)i 是 否 成立 ,显然 


iES 
可 在 多 项 式 时 间 内 完成 。 因 此 ,SUBSET-SUMENP。 
下 面 证 明 VERTEX-COVERcc,SUBSET-SUM。 
给 定 顶 点 覆盖 问题 的 一 个 实例 (G,k) ,要 在 多 项 式 时 间 内 将 其 变换 为 子 集 和 问题 的 一 
个 实例 (S,z) ,使 得 G 有 一 个 & 团 当 且 仅 当 S 有 一 个 子 集 S', 其 元 素 和 为 t。 
变换 要 用 到 图 G 的 关联 抢 阵 。 设 G= 二 (V ,E) 是 一 个 无 向 图 , 且 V= {人 voyvi,*… ,vivi-1)， 
下 一 {eo,el, elgl-i)。G 的 关联 矩阵 B 是 一 个 IV|X1E| 和 矩阵 ,B==(6b; ) ,其 中 
-人 顶点 vw 与 边 e; 相关 联 
. 0 ”其 他 情况 
图 8-4(b) 是 图 8-4(a) 的 关联 矩阵 。 为 了 便于 构造 S, 该 关联 矩阵 中 将 下 标 较 小 的 边 放 
在 右边 。 
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8-4 ”由 (G,k) 构 造 (S,z) 


对 于 给 定 的 图 G 和 整数 & ,构造 集合 S 和 整数 t 的 过 程 如 下 。 首 先 ,在 讨论 范围 内 用 一 
个 修正 的 四 进 制 表示 一 个 数 。 在 这 种 数 的 表示 法 下 ,前 |E| 位 数字 是 通常 的 四 进 制 数 字 , 而 
第 | 已 | 位 允许 超过 3, 最 大 可 到 &。 用 这 种 方式 表示 要 构造 的 整数 集 S 和 整数 +, 可 以 使 S 中 
的 数 在 做 加 法 时 各 位 数字 都 不 产生 进位 。 集 合 S 中 有 两 类 数字 ,它们 分 别 相应 于 图 G 的 项 
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点 和 边 。 
对 于 每 个 顶点 wEV,i 一 0,1,…,|V| 一 1, 构 造 与 之 相应 的 数 z; 为 


IEI=1 


一 4 十 2 bt 


j=0 


其 中 ,6; 是 G 的 关联 矩 阵 第 i 行 的 元 素 ,ij 二 0,1,…,|E| 一 1。 在 修正 的 四 进 制 表示 下 ,x; 的 
第 j 十 1 位 (0 过 j 三 1E| 一 1) 就 是 5 。z; 的 第 |E| 十 1 位 是 1。 对 于 每 条 边 e; € E,j==0,1， 
…,|E| 一 1, 构 造 一 个 与 之 相应 的 数 yj 为 : yj 一作。 在 修正 的 四 进 制 表示 下 ,y; 的 第 j 十 1 
位 为 1 ,其余 各 位 为 0,j==0,1,…,|E| 一 1。 
1EI 一 1 

令 S= {roms Tviiy yi 3- 上 一 人 4 十 > 26 4 

在 修正 的 四 进 制 表示 下 ,t 的 第 |E| 十 1 位 为 ,其 余 各 位 均 为 2。 

从 图 8-4(a) 的 图 G 构造 出 的 数 z;,z; 和 +, 及 其 修正 的 四 进 制 表示 如 图 8-4(c) 所 示 。 
这 些 数 的 构造 显然 可 在 多 项 式 时 间 内 完成 。 

现在 要 证 明 的 是 图 G 有 一 个 大 小 为 k 的 顶点 覆盖 , 当 且 仅 当 S 有 一 子 集 S', 其 和 为 i。 

首先 , 设 G 有 一 大 小 为 k 的 顶点 覆盖 V =={va ,vo，…,va}SSV。 由 此 ,定义 S 为 S 一 
{zarzas… oTa}U {yjle; 恰 与 V' 中 一 个 顶点 相关 联 ,0<j 志 |E| 一 1} 则 2 = 1。 事实 上 ， 

iE 


注意 到 ,在 S 中 各 数 的 修正 的 四 进 制 表示 中 ,第 | 天 | 十 1 位 惟有 个 1, 分 别 由 za yz ya 
贡献 ,将 它们 加 起 来 后 得 到 1 的 第 | 已 | 十 1 位 数字 &。 其 余 各 位 都 相应 于 一 条 边 we 。 由 于 人 
是 一 个 顶点 覆盖 ,每 条 边 。 至 少 与 V 中 一 个 顶点 相关 联 。 因 此 ,对 每 条 边 ej ,至 少 有 S 中 
一 个 数 zES, 其 第 j 十 1 位 为 1。 若 e 关联 于 V 中 2 个 顶点 , 则 这 2 个 顶点 所 对 应 的 数 的 第 
j 十 1 位 均 为 1。 而 此 时 ,由 S 的 定义 知 yw 华 S, 从 而 yw 第 ) 十 1 位 的 1 对 S 的 和 没有 贡献 。 
因此 ,在 这 种 情况 下 S 的 和 的 第 7 十 1 位 为 2。 另 一 种 情况 是 。 只 与 V 中 一 个 顶点 相关 联 ， 
该 顶点 相对 应 的 S 中 的 数 对 S 和 的 第 7 十 1 位 贡献 一 个 1。 此 时 ,由 S 的 定义 知 wES。 因 
此 ,yw 对 S 和 的 第 j 十 1 位 也 贡献 一 个 1。 这 种 情况 下 仍 有 S 的 和 的 第 j 十 1 位 为 2。 由 此 
即 知 ,S' 和 的 第 j 十 1 位 二 0,1,…,|E| 一 1) 均 为 2。 因 此 ， 
El—1 
了 ia 二 全 2 .4 一 上 
iES j=0 
反之 , 设 有 一 S 的 子 集 S ,其 和 为 t。 若 
S’ = {zayzayeyza)U {yn sy yp) 

则 可 以 证 明 m=&, 且 VV 二 {va ,vs，… svn} 是 G 的 一 个 顶点 覆盖 。 

事实 上 ,注意 到 ,对 于 每 条 边 e; EE,S 中 恰 有 3 个 数 的 第 j 十 1 位 为 1, 其 余 各 数 的 第 
j 十 1 位 为 0。 这 3 个 1 分 别 由 y; 和 与 e; 相关 联 的 2 个 顶点 所 对 应 的 数 的 第 j 十 1 位 所 组 
成 。 因 此 ,在 修正 的 四 进 制 表示 下 ,S' 中 数 在 做 加 法 时 各 位 都 不 会 产生 进位 。 由 于 S 的 和 
为 +, 且 t 的 第 j 十 1 位 ,j 二 0,1,…,|E| 一 1 均 为 2, 因 此 ,在 t 的 第 j 十 1 位 至 少 有 一 个 ,最 多 
有 2 个 S 中 的 数 对 其 有 贡献 。 这 也 就 是 说 e 至 少 与 V' 中 一 个 顶点 相关 联 。 因 此 ,V' 是 G 
的 一 个 顶点 覆盖 。 

由 于 只 有 za ,zz，…,zm 对 t 的 第 |E| 十 1 位 有 贡献 , 且 在 相 加 时 ,低位 不 会 产生 进位 ， 
因此 S 和 第 | 天 | 十 1 位 为 mx。 而 + 的 第 |E| 十 1 位 为 , 且 S' 的 和 为 1, 故 mx 二 k。 由 此 即 知 V 
为 G 的 一 个 大 小 为 k 的 顶点 覆盖 。 
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综 上 即 知 ,VERTEX-COVERcc,SUBSET-SUM, 从 而 SUBSET-SUMENPC。 
8.3.6 哈密 顿 回路 问题 章 


给 定 无 向 图 G=(V,E) ,判定 其 是 否 含有 一 哈密 顿 回路 。 

已 知 哈密 顿 回路 问题 是 一 个 NP 类 问题 。 现 在 证 明 3-SATcc, HAM-CYCLE。 

给 定 关 于 变量 zi ,zz,…，zw 的 3 元 合 取 范 式 9 二 C1C,…Ci ,其 中 每 个 C; 恰 有 3 个 因子 。 
根据 0 在 多 项 式 时 间 内 构造 与 之 相应 的 图 G=(V,E), 使 得 0 是 可 满足 的 当 且 仅 当 G 有 哈 
密 顿 回路 。 

构造 用 到 两 个 专用 子 图 ,它们 具有 一 些 有 用 的 特殊 性 质 。 在 许多 有 趣 的 NP 完全 性 的 
证 明 中 常用 到 这 两 个 子 图 。 

第 一 个 专用 子 图 A 如 图 8-5(a) 所 示 。 图 A 作为 另 一 个 图 G 的 子 图 时 ,只 能 通过 顶点 
ay4' 0, 久 和 图 G 的 其 他 部 分 相连 。 注 意 到 若 包 含 子 图 A 的 图 G 有 一 哈密 顿 回 路 , 则 该 哈 
密 顿 回路 为 了 通过 顶点 zi ,zz ,zs 和 zs ,只 能 以 图 8-5(b) 和 (c) 的 两 种 方式 通过 子 图 A 中 各 
顶点 。 因 此 ,可 以 将 子 图 A 看 作 由 边 a,a’ ,54 组 成 的 , 且 图 G 的 哈密 顿 回路 必须 包含 这 两 
条 边 中 恰好 一 条 边 。 为 简便 起 见 , 用 图 8-5(d) 所 示 的 图 来 表示 子 图 A。 
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(©) (d) 
图 8-5 子 图 A 的 结构 


图 8-6 中 的 图 是 要 用 到 的 第 二 个 专用 子 图 B。 图 B 作为 另 一 个 图 G 的 子 图 时 ,只 能 通 
过 顶点 六 ,2 ,0 .0 和 图 G 中 其 他 部 分 相连 。 

图 G 的 一 条 哈密 顿 回路 不 会 全 部 通过 3 条 边 (b ,加 ) ,(b ,0 ) 和 (bo )。 否 则 它 就 不 
可 能 再 通过 子 图 B 的 其 他 顶点 。 然 而 ,这 3 条 边 中 任何 一 条 或 任何 两 条 边 都 可 能 成 为 图 G 
的 哈密 回路 中 的 边 。 图 8-6 的 (a) 一 (e) 说 明了 5 种 这 样 的 情形 。 还 有 3 种 情形 可 以 通过 对 
(b) c) 和 (e) 中 图 形 做 上 下 对 称 顶 点 的 交换 得 到 。 为 简便 起 见 , 用 图 8-6(f) 中 图 形 表示 子 
图 B, 其 中 的 3 个 箭头 表示 图 G 的 任 一 哈密 顿 回 路 必须 至 少 包 含 箭头 所 指 的 3 条 路 径 之 一 。 

要 构造 的 图 G 由 许多 这 样 的 子 图 A 和 子 图 B 所 构成 。 图 G 的 结构 如 图 8-7 所 示 。0 
中 每 一 个 合 取 式 C;,1 志 ik, 对 应 于 一 个 子 图 B, 并 且 将 这 个 子 图 B 串 连 在 一 起 。 也 就 是 
说 ,车 用 bi; 表示 Ci 所 对 应 的 子 图 B 中 的 顶点 5, 则 将 5b, 和 bir1, 连 接 起 来 ,i 二 1,2,…k 一 1。 
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(b) (c) 
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(d) (e) (D 
图 8-6 子 图 B 的 结构 


这 就 构成 图 G 的 左 半 部 。 

对 于 0 中 每 个 变量 zw ,在 图 G 中 建立 两 个 与 之 对 应 的 顶点 xz。 和 xz%。 这 两 个 顶点 之 间 
有 两 条 边 相 连 ,一 条 边 记 为 e,, 另 一 条 边 记 为 e,。 这 两 条 边 用 于 表示 变量 zw 的 两 种 赋值 情 
况 。 当 G 的 哈密 顿 回 路 经 过 边 e。 时 ,对 应 于 zw 赋值 为 1, 而 当 哈 密 顿 回 路 经 过 边 ce。 时 ,对 
应 于 zw 赋值 为 0。 每 对 这 样 的 边 构 成 了 图 G 中 的 一 个 2 边 环 。 通 过 在 图 G 中 加 入 边 (z% ， 
2Zo+l) ,7 一 1,2,…,2 一 1 ,将 这 些小 环 串 连 在 一 起 ,构成 图 G 的 右 半 部 。 

将 图 G 的 左 半 部 ( 合 取 项 ) 和 右 半 部 (变量 ), 用 上 .下 两 条 边 (2 ,x1) 和 (bi ,zx ) 连 接 
起 来 ,如 图 8-7 所 示 。 

到 此 ,还 没有 完成 图 G 的 构造 ,因为 还 没有 建立 变量 与 各 合 取 项 之 间 的 联系 。 若 合 取 
项 Ci 的 第 j 个 因子 是 zw, 则 用 一 个 子 图 A 连接 边 (b ps) 和 边 en; 若 合 取 项 C; 的 第 j 
个 因子 是 zx, , 则 用 一 子 图 A 连接 边 (5;,; ,pr 和 边 ew。 

例如 , 当 Cs 二 (zi 十 zz 十 zx) 时 ,必须 在 3 对 边 (6bz,1 ,bz,z) 和 ei, (bz,s ,bz,3) 和 ez, (bs,s， 
bz.4) 和 es 之 间 各 用 一 个 子 图 A 连接 ,如 图 8-7 所 示 。 这 里 所 说 的 用 子 图 A 连接 两 条 边 , 实 
际 上 是 用 子 图 A 中 a 和 a' 之 间 的 5 条 边 以 及 5 和 6’ 之 间 的 5 条 边 取代 要 连接 的 两 条 边 , 当 
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然 还 要 加 上 连接 顶点 = ,zs 和 zs 的 边 。 一 个 给 定 的 因子 i 可 能 在 多 个 合 取 项 中 出 现 ， 。 
因此 边 ew 或 ew 可 能 要 嵌入 多 个 子 图 A 。 在 这 种 情况 下 ,将 多 个 子 图 A 串 连 在 一 起 ,并 用 串 章 


连 后 的 边 去 取代 边 e 或 ev ,如 图 8-8 所 示 。 


QE QE 


(a) 
图 8-7 图 G 的 结构 图 8-8 子 图 4 的 串 连 


至 此 ,已 完成 图 G 的 构造 。 并 且 可 以 断言 合 取 范 式 0 可 满足 当 且 仅 当 图 G 有 一 哈密 顿 
回路 。 

事实 上 , 若 图 G 有 一 哈密 顿 回 路 五 , 则 由 于 图 G 的 特殊 性 , 互 必定 具有 以 下 特殊 形式 ， 

(1) 瓦 经 过 边 (04 ,x1) 从 G 的 顶部 左边 到 达 顶 部 右边 。 

(2) 电 经 边 e， 或 ew 中 一 条 (不 同时 经 边 e, 和 ew), 自 顶 向 下 经 过 所 有 顶点 x 和 xz 。 

(3) 及 经 过 边 (bi, 式 ) 回 到 G 的 左边 。 

(4) 电 经 过 各 子 图 B 从 底部 回 到 顶部 。 

五 实际 上 也 经 过 各 子 图 A 的 内 部 。H 经 过 子 图 A 内 部 的 两 种 不 同方 式 取决 于 互 经 
过 的 是 被 子 图 A 连接 的 两 条 边 中 的 哪 一 条 边 。 

对 于 图 G 的 任意 一 条 哈密 顿 回路 太 , 可 以 定义 9 的 一 个 真 值 赋 值 如 下 。 当 边 e 是 五 
中 一 条 边 时 , 取 zx, 二 1; 否 则 e。 是 互 的 一 条 边 , 取 zx, 二 0。 

按 这 种 赋值 ,可 使 9 二 1。 事 实 上 ,考虑 9 的 每 一 合 取 项 C; 及 其 对 应 的 图 G 中 的 子 图 B。 
根据 C; 中 第 j 个 因子 是 xz, 或 x, ,每 条 边 (b;,; ,b,j+1) 由 一 个 子 图 A 与 边 e， 或 e。 连接 。 边 
(bij wbij+1) 是 日 中 的 边 当 且 仅 当 C; 中 相应 的 因子 取 值 0。 因为 C; 中 3 个 因子 相应 的 3 条 
边 (0 ,0i2)，(bis bi,s)，(bis ,bi ) 均 在 子 图 B 中 ,由 子 图 B 的 性 质 可 知 态 不 可 能 包含 所 有 
这 3 条 边 。 因 此 ,这 3 条 边 所 相应 的 C; 中 3 个 因子 至 少 有 一 个 取 值 1, 即 C; 取 值 1。 由 于 
C; 是 任意 的 ,所 以 C; 二 1,i 一 1,2,…,k。 也 就 是 说 ,0 是 可 满足 的 。 
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反之 , 若 0 是 可 满足 的 , 则 有 zi ,zs，… ,x 的 一 个 真 值 赋值 ,使 得 9 二 1。 据 此 ,可 构造 图 
G 的 哈密 顿 回路 如 下 : 

(1) 从 G 的 顶点 bi 开始 ,经 过 边 (b1,1 ,zx1) 到 达 图 G 的 右边 。 

(2) 在 从 x 到 x 的 路 中 ,车 zx 二 1 则 经 过 边 ew ,否则 经 过 边 或 6, 。 

(3) 经 过 边 (b44, 式 ) 回 到 图 G 的 左边 。 

(4) 在 从 bi 到 0 的 路 中 , 若 Ci 的 第 j 个 因子 取 值 0 则 经 过 边 (6;,; ,bi,j+1) ,否则 不 经 
过 该 边 。 由 子 图 B 的 性 质 及 C;=1 知 ,这 总 是 可 行 的 。 

如 此 构造 出 的 图 G 的 回路 瑟 , 经 过 G 的 每 个 顶点 恰好 一 次 , 故 它 是 图 G 的 一 条 哈密 顿 回路 。 

最 后 ,要 说 明 图 G 的 构造 可 在 多 项 式 时 间 内 完成 。 事 实 上 ,9 的 每 个 合 取 项 对 应 于 图 G 
中 一 个 子 图 B, 总 共有 上 个子 图 B。9 中 每 个 合 取 项 中 的 每 个 因子 对 应 于 一 个 子 图 A ,总 共 
有 3& 个 子 图 A。 每 个 子 图 A 和 子 图 B 的 大 小 都 是 固定 的 ,因此 ,图 G 有 O(C) 个 顶点 和 边 。 
因此 ,可 在 多 项 式 时 间 内 构造 出 图 G。 由 此 得 出 ,3-SATcc, HAM-CYCLE, 从 而 HAM- 
CYCLEENPC。 


8.3.7 旅行 售货员 问题 


给 定 一 个 无 向 完全 图 G==(V,E) 及 定义 在 VXV 上 的 一 个 费用 函数 c 和 一 个 整数 &, 判 
定 G 是 否 存在 经 过 V 中 各 顶点 恰好 一 次 的 回路 ,使 得 该 回路 的 费用 不 超过 A。 
旅行 售货员 问题 与 哈密 顿 回路 问题 很 相像 ,它们 之 间 有 着 密切 的 联系 。 哈 密 顿 回路 问 
题 可 在 多 项 式 时 间 内 变换 为 旅行 售货员 问题 。 设 图 G=(V,E) 是 HAM-CYCLE 的 一 个 实 
例 , 据 此 ,构造 TSP 的 一 个 实例 如 下 。 设 已 ={1G71i7EV) ,构造 一 个 完全 图 G' =(V， 
已 ), 且 定义 费用 函数 c 为 
f (i EE 
(i EE 
则 相应 的 TSP 实例 为 (G',c.0) ,这 显然 可 在 多 项 式 时 间 内 完成 。 
下 面 证 明 G 有 一 个 哈密 顿 回 路 当 且 仅 当 G“ 有 一 个 费用 为 0 的 旅行 售货员 回路 。 事 实 
上 , 若 G 有 一 个 哈密 顿 回路 五 ,显然 五 也 是 G 的 一 个 旅行 售货员 回路 。 由 于 的 每 一 边 
均 属 于 巨 , 故 每 边 的 费用 均 为 0。 因此 互 是 G 的 一 个 费用 为 0 的 旅行 售货员 回路 。 反 之 ， 
若 G 有 一 个 费用 为 0 的 旅行 售货员 回路 互 , 由 费用 函数 c 的 定义 知 ,HH 的 每 边 费 用 均 为 0， 
从 而 互 的 每 条 边 均 属 于 玉 。 故 日 为 G 的 一 条 哈密 顿 回 路 。 
因此 ,HAM-CYCLEcc,TSP。 即 旅行 售货员 问题 是 NP 难 的 。 
TSPE NP 是 显然 的 ,给 定 TSP 的 一 个 实例 (G,c,k) 和 一 个 由 个 项 点 组 成 的 项 点 序 
列 。 验 证 算法 要 验证 这 个 顶点 组 成 的 序列 是 图 G 的 一 条 回路 , 且 经 过 每 个 顶点 一 次 。 另 
外 ,将 每 条 边 的 费用 加 起 来 ,并 验证 所 得 的 和 不 超过 &。 这 个 过 程 显然 可 在 多 项 式 时 间 内 完 
成 , 即 TSPENP。 因 此 ,TSPENPC。 


8.4 近似 算法 的 性 能 


迄今 为 止 , 所 有 的 NP 完全 问题 都 还 没有 多 项 式 时 间 算 法 。 然 而 有 许多 NP 完全 问题 
具有 很 重要 的 实际 意义 ,经 常会 遇 到 。 对 于 这 类 问题 ,通常 可 以 采取 以 下 几 种 解 题 策略 : 
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(1) 只 对 问题 的 特殊 实例 求解 。 遇 到 一 个 NP 完全 问题 时 ,应 仔细 考查 是 否 必 须 在 最 
一 般 的 意义 下 求解 ,也 许 只 要 针对 某 种 特殊 情形 求解 就 够 了 ,而 在 特殊 情形 下 常 可 得 到 高 效 
算法 。 

(2) 用 动态 规划 法 或 分 支 限 界 法 求解 。 动 态 规划 法 和 分 支 限界 法 是 解 许 多 NP 完全 问 
题 的 有 效 方法 。 在 许多 情况 下 ,它们 比 穷 举 搜索 法 有 效 得 多 。 

(3) 用 概率 算法 求解 。 有 时 可 通过 概率 分 析 法 证 明 某 个 NP 完全 问题 的 “ 难 ” 实 例 是 很 
稀少 的 。 因 此 ,可 用 概率 算法 解 这 类 NP 完全 问题 ,设计 出 在 平均 情况 下 的 高 效 算法 。 

(4) 只 求 近 似 解 。 由 于 问题 的 输入 数据 通常 是 用 测量 的 方法 得 到 的 ,因此 输入 数据 
本 身 就 是 近似 的 。 在 实际 中 遇 到 的 NP 完 全 问题 因此 也 不 要 求 一 定 要 获得 非常 精确 的 解 
答 , 只 要 求 在 一 定 的 误差 范围 内 的 近似 解 就 够 了 。 许 多 解 NP 完全 问题 的 近似 算法 可 以 
用 很 少 的 时 间 获 得 很 好 的 近似 解 。 这 是 在 实践 中 解决 NP 完全 问题 的 非常 有 效 且 实用 的 
方法 。 

(5) 用 启发 式 方法 求解 。 在 用 别 的 方法 都 不 能 奏效 时 ,也 可 采用 启发 式 算法 解 NP 完 
全 问题 。 这 类 方法 根据 具体 问题 设计 一 些 启发 式 搜索 策略 寻求 问题 的 解 。 在 实际 使 用 时 可 
能 很 有 效 ,但 很 难说 清 它 的 道理 。 

本 章 主要 讨论 解 NP 完全 问题 的 近似 算法 。 

许多 NP 完全 问题 实质 上 是 最 优化 问题 , 即 要 求 使 某 个 目标 函数 达到 最 大 值 或 最 小 值 
的 解 。 不 失 一 般 性 ,对 于 确定 的 问题 ,假设 其 每 一 个 可 行 解 所 对 应 的 目标 函数 值 均 不 小 于 一 
个 确定 的 正 数 。 

若 一 个 最 优化 问题 的 最 优 值 为 ”, 求 解 该 问题 的 一 个 近似 算法 求 得 的 近似 最 优 解 相应 


的 目标 函数 值 为 c, 则 将 该 近似 算法 的 性 能 比 定义 为 y= max{£， 二 |. 在 通常 情况 下 ,该 性 


能 比 是 问题 输入 规模 的 一 个 函数 p(n). 即 max{ 三， pn) 


这 个 定义 对 于 极 小 化 问题 和 极 大 化 问题 都 是 适用 的 。 对 于 一 个 极 大 化 问题 ,0 二 cc*。 
此 时 近似 算法 的 性 能 比 ,表示 最 优 值 " 比 近似 最 优 值 c 大 多 少 倍 。 对 于 一 个 极 小 化 问题 ， 
0<c 过 c。 此 时 ,近似 算法 的 性 能 比 表 示 近 似 最 优 值 c 比 最 优 值 c* 大 多 少 倍 。 由 c/c* 二 1 
可 以 推出 c” /c>1, 故 近似 算法 的 性 能 比 不 会 小 于 1。 一 个 能 求 得 精确 最 优 解 的 算法 的 性 能 
比 为 1。 在 通常 情况 下 ,近似 算法 的 性 能 比 大 于 1。 近 似 算法 的 性 能 比 越 大 , 它 求 出 的 近似 
最 优 解 就 越 差 。 

有 时 用 相对 误差 表示 一 个 近似 算法 的 精确 程度 会 更 方便 些 。 若 最 优化 问题 的 精确 最 优 
值 为 c* ,而 一 个 近似 算法 求 出 的 近似 最 优 值 为 c, 则 该 近似 算法 的 相对 误差 定义 为 4 二 


< 一 所 | 。 近 似 算法 的 相对 误差 总 是 非 负 的 。 若 对 问题 的 输入 规模 n, 有 一 个 函数 e() 使 得 


态 e() , 则 称 eln) 为 该 近似 算法 的 相对 误差 界 。 近 似 算法 的 性 能 比 p(70) 与 相对 误 


差 界 e(n) 之 间 显然 有 如 下 关系 : e(n) 夺 p(n) 一 1。 

有 许多 问题 的 近似 算法 具有 固定 的 性 能 比 或 相对 误差 界 , 即 p(x) 或 e(n) 是 不 随 n 的 变 
化 而 变化 的 。 在 这 种 情况 下 :用 o 和 es 来 记性 能 比 和 相对 误差 界 ,表示 它们 不 依赖 于 7。 当 
然 , 还 有 许多 问题 没有 固定 性 能 比 的 多 项 式 时 间 近 似 算法 ,其 性 能 比 只 能 随 着 输入 规模 的 
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增长 而 增 大 。 

对 有 些 NP 完全 问题 ,可 以 找到 这 样 的 近似 算法 ,其 性 能 比 可 以 通过 增加 计算 量 来 改 
进 。 也 就 是 说 ,在 计算 量 和 解 的 精确 度 之 间 有 一 个 折 中 。 较 少 的 计算 量 得 到 较 粗 糙 的 近似 
解 , 而 较 多 的 计算 量 可 以 获得 较 精确 的 近似 解 。 

一 个 最 优化 问题 的 近似 格式 是 指 带 有 近似 精度 s>0 的 一 类 近似 算法 。 对 于 固定 的 es 
0, 该 近似 格式 表示 的 近似 算法 的 相对 误差 界 为 s。 若 对 固定 的 s 之 0 和 问题 的 一 个 输入 规模 
为 n 的 实例 ,用 近似 格式 表示 的 近似 算法 是 多 项 式 时 间 算 法 , 则 称 该 近似 格式 为 多 项 式 时 间 
近似 格式 。 

多 项 式 时 间 近 似 格式 的 计算 时 间 不 应 随 e 的 减少 而 增长 得 太 快 。 在 理想 的 情况 下 , 若 e 
减少 某 一 常数 倍 , 近 似 格式 的 计算 时 间 增 长 也 不 超过 某 一 常数 倍 。 换 句 话 说 ,希望 近似 格式 
的 计算 时 间 是 1/e 和 nn 的 多 项 式 。 

当 一 个 问题 的 近似 格式 的 计算 时 间 是 关于 1/e 和 问题 实例 的 输入 规模 的 多 项 式 时 ， 
称 该 近似 格式 为 一 完全 多 项 式 时 间 近 似 格式 ,其 中 。 是 该 近似 格式 的 相对 误差 界 。 

下 面 针 对 一 些 常 见 的 NP 完全 问题 ,研究 有 效 近 似 算 法 的 设计 与 分 析 方 法 。 


8.5 顶点 覆盖 问题 的 近似 算法 


无 向 图 G 二 (V,E) 的 顶点 覆盖 是 它 的 顶点 集 V 的 一 个 子 集 V'SV ,使 得 若 (u,v) 是 G 
的 一 条 边 , 则 vEV' 或 EV 。 顶 点 覆盖 V' 的 大 小 是 它 所 包含 的 顶点 个 数 |V”|。 
8.4 节 中 ,将 顶点 覆盖 问题 表述 为 一 个 判定 问题 ,并 证 明了 它 的 NP 完全 性 。 最 优化 形 
式 的 顶点 覆盖 问题 是 要 找 出 图 G 的 最 小 顶点 覆盖 。 由 于 与 其 相应 的 判定 问题 是 NP 完全 
的 , 故 最 优化 形式 的 顶点 覆盖 问题 是 NP 难 的 。 虽 然 要 找到 G 的 一 个 最 小 顶点 覆盖 可 能 是 
很 困难 的 ,但 要 找到 一 个 近似 最 优 的 项 点 覆盖 却 不 太 困 难 。 下 面 的 近似 算法 以 无 向 图 G 为 
输入 ,并 计算 出 G 的 近似 最 优 项 点 覆盖 ,可 以 保证 计算 出 的 近似 最 优 项 点 覆盖 的 大 小 不 会 
超过 最 小 顶点 覆盖 大 小 的 2 倍 。 
VertexSet approxVertexCover (Graph g) 
{ 
cset 一 他; 
el=g. e; 
while (el!l=8) 
{ 
从 el 中 任 取 一 条 边 (u,v); 
cset=csetU {u,v}; 
从 el 中 删 去 与 u 和 v 相关 联 的 所 有 边 ; 
} 


returnc 


} 
算法 approxVertexCover 用 cset 存储 顶点 覆盖 中 的 各 顶点 。 初 始 时 cset 为 空 ,然后 在 


算法 的 循环 中 不 断 从 边 集 el 中 选取 一 边 (u.wv) ,将 边 的 端点 加 入 cset 中 ,并 将 el 中 已 被 x 
和 覆盖 的 边 删 去 ,直至 cset 已 覆盖 所 有 边 , 即 el 为 空 时 为 止 。 
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图 8-9 说 明了 算法 approxVertexCover 的 运行 情况 。 图 8-9(a) 是 作为 算法 输入 的 图 
G, 它 有 7 个 顶点 和 8 条 边 。 图 8-9(b) 表 示 算 法 选择 了 边 (b,c) ,并 将 顶点 b 和 c 加 入 顶点 
盖 c 中 ,然后 将 el 中 与 顶点 b 和 c 相 关联 的 边 (a,b),(c,e),(c,d) 和 (b,c) 从 el 中 删 去 。 
图 8-9(c) 表 示 算 法 选择 了 边 (e,f) ,并 将 顶点 e 和 f 加 入 顶点 覆盖 cset 中 。 图 8-9(d) 表 示 算 
法 最 后 选择 了 边 (d,g)。 图 8-9(e) 表 示 算 法 产生 的 近似 最 优 顶 点 覆盖 cset, 它 由 顶点 b,c， 
d,e,f,g 所 组 成 。 图 8-9(f) 是 图 G 的 一 个 最 小 项 点 覆盖 , 它 只 含有 3 个 顶点 : b,d 和 e。 
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图 8-9 项 点 覆盖 问题 的 近似 算法 


下 面 考 查 近 似 算 法 approxVertexCover 的 性 能 。 若 用 A 记 作 算法 循环 中 选取 出 的 边 
的 集合 , 则 A 中 任何 两 条 边 没 有 公共 端点 。 因 为 算法 选择 了 一 条 边 ,并 在 将 其 端 顶 点 加 入 
顶点 覆盖 集 cset 后 ,就 将 el 中 与 该 边关 联 的 所 有 边 从 el 中 删 去 。 因 此 ,下 一 次 再 选 出 的 边 
就 与 该 边 没 有 公共 端点 。 由 数学 归纳 法 易 知 ,A 中 各 边 均 没 有 公共 端点 。 算 法 终止 时 有 
| cset| 王 21A| 。 另 一 方面 ,图 G 的 任 一 顶点 覆盖 ,一 定 包含 A 中 各 边 的 至 少 一 个 端 顶点 ， 
G 的 最 小 项 点 覆盖 也 不 例外 。 因 此 , 若 最 小 项 点 覆盖 为 cset" , 则 |cset* | 三 |A1。 由 此 可 得 
|cset| 三 2|cset" | 。 也 就 是 说 ,算法 approxVertexCover 的 性 能 比 为 2。 


8.6 旅行 售货员 问题 近似 算法 


以 最 优化 形式 提出 的 旅行 售货员 问题 可 描述 为 : 给 定 一 个 完全 无 向 图 G=(V,E) ,其 
每 一 边 (u,v) EE 有 一 非 负 整数 费用 c (u,v)。 要 找 出 G 的 最 小 费用 哈密 顿 回路 。 

从 实际 应 用 中 抽象 出 的 旅行 售货员 问题 常 具 有 一 些 特 殊 性 质 。 比 如 ,费用 函数 c 往往 
具有 三 角 不 等 式 性 质 , 即 对 任意 的 3 个 顶点 u,v,wEV, 有 clusw) 三 c(usv) 十 c(v,w)。 当 
图 G 中 的 顶点 就 是 平面 上 的 点 ,任意 2 顶点 间 的 费用 就 是 这 2 点 间 的 欧 几 里 得 距离 (简称 
欧 氏 距离 ) 时 ,费用 函数 c 就 具有 三 角 不 等 式 性 质 。 

可 以 证 明 , 即 使 费用 函数 具有 三 角 不 等 式 性 质 ,旅行 售货员 问题 仍 为 NP 完全 问题 。 因 
此 ,不 太 可 能 找到 解 此 问题 的 多 项 式 时 间 算 法 。 转 而 寻求 解 此 问题 的 有 效 的 近似 算法 。 当 
费用 函数 c 具有 三 角 不 等 式 性 质 时 ,可 以 设计 出 一 个 近似 算法 ,其 性 能 比 为 2。 而 对 于 一 般 
情况 下 的 旅行 售货员 问题 则 不 可 能 设计 出 具有 常数 性 能 比 的 近似 算法 ,除非 P= NP。 
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8.6.1 有 具有 三 角 不 等 式 性 质 的 旅行 售货员 问题 


对 于 给 定 的 无 向 图 G, 可 以 利用 找 图 G 的 最 小 生成 树 的 算法 设计 找 近似 最 优 的 旅行 售 
货 员 回路 的 算法 。 当 费用 函数 满足 三 角 不 等 式 时 ,算法 找 出 的 旅行 售货员 回路 的 费用 不 会 
超过 最 优 旅行 售货员 回路 费用 的 2 倍 。 


void approxTSP (Graph g) 
{ 

@ 选择 g 的 任 一 顶点 ; 

@ 用 Prim 算法 找 出 带 权 图 g 的 一 棵 以 r 为 根 的 最 小 生成 树 T; 

@ 前 序 遍历 树 工 得 到 的 顶点 表 L; 

@ 将 r 加 到 表 L 的 末尾 , 按 表 L 中 顶点 次 序 组 成 回路 也, 作为 计算 结果 返回 。 
} 


图 8-10 说 明了 算法 approxTSP 的 运行 情况 。 


图 8-10 旅行 售货员 问题 的 近似 算法 


图 8-10(a) 表 示 所 给 的 图 G 的 顶点 集 。 图 8-10(b) 表 示 由 算法 找到 的 一 棵 最 小 生成 树 
T。 图 8-10(c) 表 示 对 树 工 所 作 的 前 序 遍历 访问 各 顶点 的 次 序 。 图 8-10(d) 表 示 由 工 的 前 
序 遍历 顶点 表 革 产生 的 哈密 顿 回路 囊 。 图 8-10(e) 是 G 的 一 个 最 小 费用 旅行 售货员 回路 。 

图 8-10 中 各 顶点 表示 平面 上 的 一 个 点 。 图 中 方 格 的 边 长 为 1。 各 顶点 间 的 边 费 用 为 
顶点 间 的 欧 几 里 得 距离 ,因而 费用 函数 满足 三 角 不 等 式 。 从 该 例 算出 的 近似 最 优 旅行 售 货 
员 回 路 互 可 看 出 ,最 小 费用 要 比 有 H 的 费用 少 约 23%。 

由 于 图 G 是 一 个 完全 图 , 易 知 算法 approxTSP 的 计算 时 间 为 0(IE|)==0(1V1?)。 算 法 
中 没有 明显 地 用 到 费用 函数 的 三 角 不 等 式 性 质 。 因 此 ,该 算法 也 适用 于 一 般 的 旅行 售货员 
问题 。 当 费用 函数 满足 三 角 不 等 式 时 ,该 算法 具有 较 好 的 性 能 比 , 即 对 于 任何 无 向 完全 图 
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G, 算 法 具有 一 个 常数 性 能 比 2。 换 句 话 说, 若 用 瓦 " 记 图 G 的 最 小 费用 旅行 售货员 回路 ,而 
用 互 记 算法 approxTSP 计算 出 的 近似 最 优 的 旅行 售货员 回路 , 则 c(CBHD) 近 2c( 五 " )。 其 中 ， 
cA)= py cu,v)。 下 面 证 明 这 一 结论 。 


(WEA 

设 工 是 算法 approxTSP 计算 出 的 图 G 的 最 小 生成 树 。 从 五 " 中 任意 删 去 一 条 边 后 ,可 
得 到 图 G 的 一 棵 生成 树 。 由 于 本 是 最 小 生成 树 , 故 有 c(T) 三 c(H* )。 对 树 工 所 做 的 一 个 
完全 遍历 是 在 访问 工 的 一 个 顶点 时 列 出 该 顶点 ,而 在 结束 对 T 的 一 棵 子 树 的 访问 并 沿途 返 
回 时 也 列 出 返回 时 经 过 的 顶点 。 设 W 是 对 T 依 前 序 所 做 的 完全 遍历 。 例 如 ,在 图 8-10(b) 
中 ,对 工 所 做 的 完全 遍历 为 W==abcbhbadefegeda。 由 于 对 了 所 做 的 完全 遍历 W 经 过 工 的 
每 条 边 恰 好 2 次 ,所 以 有 clW)==2c(T) 三 2c(H* )。 然 而 W 还 不 是 一 个 旅行 售货员 回路 ， 
它 访问 了 图 G 中 某 些 项 点 多 次 。 由 于 费用 函数 满足 三 角 不 等 式 ,可 以 在 W 的 基础 上 ,从 中 
删 去 已 访问 过 的 顶点 ,而 不 会 增加 旅行 费用 。 若 在 W 中 删 去 顶点 w 和 w 间 的 一 个 顶点 v， 
就 用 边 (wu,w) 代 替 原 来 从 到 w 的 一 条 路 。 反 复 用 这 个 办 法 删 去 W 中 多 次 访问 的 顶点 可 
得 到 G 的 一 条 旅行 售货员 回路 。 在 图 8-10 所 示 的 例子 中 ,从 W 中 删 去 重复 访问 顶点 后 得 
到 的 回路 为 玉 二 abchdefga。 这 就 是 算法 approxTSP 计算 出 的 近似 最 优 哈密 顿 回路 。 由 费 
用 函数 的 三 角 不 等 式 性 质 即 知 ,c( 昌 ) 三 c(W) 志 2c(H* )。 也 就 是 说 ,算法 approxTSP 的 性 
能 比 为 2。 


8.6.2 一 般 的 旅行 售货员 问题 


尽管 算法 approxTSP 可 以 用 于 解 一 般 的 旅行 售货员 问题 ,但 是 不 能 保证 在 一 般 的 情况 
下 它 具 有 好 的 性 能 比 。 在 费用 函数 不 一 定 满足 三 角 不 等 式 的 一 般 情况 下 ,不 存在 具有 常数 
性 能 比 的 解 TSP 问题 的 多 项 式 时间 近 似 算 法 ,除非 P= 二 NP。 换 句 话 说 ,车 P 取 NP, 则 对 任 
意 常数 op 二 1, 不 存在 性 能 比 为 p 的 解 旅行 售货员 问题 的 多 项 式 时 间 近 似 算 法 。 事 实 上 ,假设 
车 有 一 个 解 旅行 售货员 问题 的 近似 算法 A, 其 性 能 比 为 p 三 1。 不 失 一 般 性 可 设 6 为 一 正 整 
数 , 因 车 不 然 , 可 用 [po 代替 p。 在 这 个 假设 下 ,可 以 利用 算法 A 设计 一 个 解 哈密 顿 回 路 问题 
的 多 项 式 时 间 算 法 。 由 于 哈密 顿 回路 问题 是 NP 完全 的 , 故 找到 了 它 的 一 个 多 项 式 时 间 算 
法 就 证 明了 P=NP。 因 此 ,在 P 关 NP 的 前 提 下 ,对 任意 o 三 1 这 样 的 算法 A 是 不 存在 的 。 

下 面 说 明 如 何 用 算法 A 解 哈密 顿 回路 问题 。 设 图 G=(V.,E) 是 哈密 顿 回路 问题 的 一 个 
实例 ,要 求 判定 G 是 否 有 一 条 哈密 顿 回路 。 为 了 利用 算法 A 解 G 的 哈密 顿 回路 问题 ,将 G 
变换 为 旅行 售货员 问题 的 一 个 实例 (G1,c) 如 下 。 其 中 ,G1 是 顶点 集 V 上 的 一 个 完全 图 , 即 
Gl 二 (V,E1) ,El 二 {(wu,v)|u,v€V 且 w 关 v)。E1l 中 每 一 边 的 费用 clu,v) 定 义 为 

寺 (uv) EE 
cl(usv) = s 
Lewin (wo) €E El—E 

如 上 定义 的 图 Gl 和 费用 函数 c 显然 可 根据 图 G 在 关于 IV|1 和 |E| 的 多 项 式 时 间 内 构造 
出 来 。 

现在 考虑 旅行 售货员 问题 4Gl,c)。 若 原 图 G 有 一 哈密 顿 回路 态 , 则 费用 函数 c 赋 给 互 
中 每 边 的 费用 均 为 1。 因 此 ,(G1,c) 含 有 一 个 费用 为 |V | 的 旅行 售货员 回路 。 另 一 方面 ,车 
G 中 不 存在 哈密 顿 回路 , 则 G1 的 任 一 回路 必用 到 了 不 在 EE 中 的 边 。 因 此 ,在 这 种 情况 下 ， 
《G1,c) 的 任 一 旅行 售货员 回路 的 费用 至 少 为 (pI|V| 十 DD) 二 +(IV| 一 D>plV|。 
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若 用 算法 A 解 旅行 售货员 问题 4G1,c), 则 它 求 出 的 近似 最 优 的 旅行 售货员 回路 互 的 
费用 c( 互 ) 不 超过 最 优 旅行 售货员 回路 昌 * 的 费用 的 p 倍 , 即 c(H)<pe(H* ) 。 

当 G 有 哈密 顿 回 路 五 时 , 易 知 c( 昌 )==c(H* ) 王 |V| ,而 由 算法 A 找到 的 旅行 售货员 回 
路 互 的 费用 c(BD) 近 pc( 互 " ) 一 olV|。 由 上 面 的 分 析 可 知 , 中 每 一 条 边 均 属 于 下 , 故 媚 也 
是 G 的 一 条 哈密 顿 回路 。 

反之 , 若 算 法 A 找 出 的 旅行 售货员 回路 所 的 费用 c(H)pIV1, 则 plV| 二 eC(H) 志 
pc(H*)。 由 此 可 知 c(H*)1V1, 即 (G1l,c) 的 最 优 旅行 售货员 回路 H* 的 费用 
c(H"* ) 过 |IV|。 由 上 面 的 分 析 即 知 , 此 时 G 中 不 存在 哈密 顿 回路 。 因 此 ,算法 A 求 出 (G1， 
c)》 的 近似 最 优 的 旅行 售货员 回路 互 后 ,只 要 再 判断 其 费用 c( 互 ) 是 否 为 |V| , 即 可 判定 G 是 
和 否 有 一 条 哈密 顿 回路 。 由 假设 知 , 算 法 A 可 在 多 项 式 时 间 内 完成 , 故 可 在 多 项 式 时 间 内 解 
哈密 顿 回 路 问题 。 在 P 冯 NP 的 前 提 下 ,这 是 不 可 能 的 。 因 此 ,所 假设 的 这 样 的 算法 A 在 
P 关 NP 的 前 提 下 是 不 存在 的 。 


8.7 集合 覆盖 问题 的 近似 算法 


集合 覆盖 问题 是 一 个 最 优化 问题 ,其 原型 是 多 资源 选择 问题 。 集 合 覆 盖 问 题 可 以 看 作 
是 图 的 顶点 覆盖 问题 的 推广 ,因此 , 它 也 是 一 个 NP 难 问题 。 
集合 覆盖 问题 的 一 个 实例 (X,F) 由 一 个 有 限 集 X 及 X 的 一 个 子 集 族 F 组 成 。 子 集 族 
下 覆盖 了 有 限 集 X 。 也 就 是 说 X 中 每 一 元 素 至 少 属于 下 中 的 一 个 子 集 , 即 X 一 5S。 对 于 
下 中 的 一 个 子 集 CSF, 若 C 中 的 X 的 子 集 覆盖 了 X , 即 XX 二 US, 则 称 C 覆盖 了 X 。 集 合 
覆盖 问题 就 是 要 找 出 下 中 覆盖 X 的 最 小 子 集 C" ,使 得 
1C*" |= min{|1C1|CSF 且 C 覆盖 XX} 


Ss,S4 ,Ss ,Ss) ,如 图 8-11 所 示 。 容 易 看 出 ,对 于 这 个 例子 ， 


最 小 集合 覆盖 为 C={S;,,S, ,Ss}。 @ @ @ 
集合 覆盖 问题 是 对 许多 常见 的 组 合 问题 的 抽象 。 例 8 

如 ,假设 X 表示 解决 某 一 问题 所 需 的 各 种 技巧 的 集合 , 且 | | e . . 

给 定 一 个 可 用 来 解决 该 问题 的 人 的 集合 ,其 中 每 个 人 掌握 。 | 驴 Ss, 

若干 种 技巧 。 希 望 从 这 个 人 的 集合 中 选 出 尽 可 能 少 的 人 组 ”|[® . . 

成 一 个 委员 会 ,使 得 X 中 的 每 一 种 技巧 ,都 可 以 在 委员 会 Ss 

中 找到 掌握 该 技巧 的 人 。 这 个 问题 实质 上 就 是 一 个 集合 覆 。 | ® . 


羡 问 题 。 集 合 覆盖 问题 是 一 个 NP 完全 问题 。 
对 于 集合 覆盖 问题 ,可 以 设计 出 一 个 简单 的 贪心 算法 ， 图 8-11 集合 覆盖 问题 的 一 个 

求 该 问题 的 一 个 近似 最 优 解 。 这 个 近似 算法 具有 对 数 性 能 二 

比 。 算 法 描述 如 下 ， 


Set greedySetCover (X,F) 


{ 
划一 区 
C=8; 
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while (U! 一) { 
选择 下 中 使 |SNU| 最 大 的 子 集 S; 8 
U=U—S; 章 
C=CU{S}; 
} 

return C; 


} 


在 算法 greedySetCover 中 ,集合 U 用 于 存放 在 每 一 阶段 中 尚未 被 覆盖 的 X 中 元 素 。 
集合 C 包含 了 当前 已 构造 的 覆盖 。 算 法 的 循环 体 是 整个 算法 的 主体 。 在 该 循环 体 中 ,首先 
选择 正中 覆盖 了 尽 可 能 多 的 未 被 覆盖 元 素 的 子 集 S。 然 后 ,将 U 中 被 S 覆盖 的 元 素 删 去 ， 
并 将 S 加 入 C。 算 法 结束 时 ,C 中 包含 了 覆盖 X 的 下 的 一 个 子 集 族 。 例 如 ,对 于 图 8-11 中 
的 例子 ,算法 greedySetCover 依次 选 出 子 集 Si ,Ss ,S: 和 Ss 构成 子 集 族 C。 

算法 greedySetCover 的 循环 体 最 多 执行 min{1Xl ,|FI} 次。 而 循环 体内 的 计算 显然 可 
在 OCUXIIF|) 时 间 内 完成 。 因 此 ,算法 的 计算 时 间 为 OCIXIIFIlmin{|X|,|F|})。 由 此 即 
知 ,greedySetCover 是 一 个 多 项 式 时 间 算 法 。 

从 图 8-11 所 给 的 例子 可 以 看 出 ,算法 greedySetCover 得 到 的 只 是 集合 X 的 近似 最 优 
覆盖 。 下 面 进一步 考虑 算法 greedySetCover 的 性 能 比 。 为 方便 起 见 , 用 互 (d) 记 第 d 级 调 


d 
和 数 , 即 HCd) = > 证 。 用 这 个 记号 ,可 以 证 明 算法 greedySetCover 的 性 能 比 为 Hmax 
i=1 


{1S|})。 证 明 过 程 如 下 。 对 于 每 一 个 由 算法 greedySetCover 选 出 的 集合 赋予 其 一 个 费用 ， 
并 将 这 个 费用 分 布 于 初次 被 覆盖 的 X 中 的 元 素 上 。 然 后 ,再 利用 这 些 费 用 导出 所 需要 的 算 
法 greedySetCover 的 性 能 比 。 设 5; 表示 由 算法 greedySetCover 的 while 循环 所 选 出 的 第 i 
个 子 集 。 在 算法 将 S; 加 入 子 集 族 C 时 ,赋予 S; 一 个 费用 1, 并 将 这 个 费用 平均 地 分 挫 给 S; 


中 刚 被 覆盖 的 X 中 的 元 素 , 即 S, 一 U S, 中 的 元 素 。 对 每 一 个 zeEX, 用 C, 表示 元 素 z 捧 到 
的 费用 。 注 意 ,每 个 元 素 z 在 它 第 一 次 被 覆 羡 时 得 到 费用 C,, 且 只 得 到 一 次 ,以 后 不 再 得 到 
费用 。 车 第 一 次 被 集合 S; 覆盖 , 则 


C 
i | S: 一 (SUSU…USe) 1 


算法 终止 时 ,得 到 子 集 族 C, 其 总 费用 为 |C|。 这 个 费用 分 布 于 X 中 的 各 元 素 上 , 即 
1C1= >) C, 。 由 于 X 的 最 优 覆 盖 C* 也 是 X 的 一 个 覆盖 , 故 
XEX 
Ieee Cs 


EX Sec* rzES 
稍 后 还 将 证 明 ,对 于 子 集 族 下 中 任 一 子 集 S ,有 
DC. < HS 


zES 


由 此 可 得 
Icl< 3 HY sD<IC | Homaxtl SI) 


SEC” 


由 此 即 知 算法 greedySetCover 的 性 能 比 为 
El< H(max!| Ss1y 
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下 面 回来 证 明 》) C; 过 H(| S |) .对 于 任 一 下 中 的 集合 SE 下 以 及 i 一 1,2,…,|C|1， 
xXES 


设 w=|S—U S; | 是 算法 选择 了 Si ,S,,…,S; 后 ,S 中 尚 存 的 未 被 覆盖 元 素 的 个 数 。 其 中 ， 
u 定义 为 初始 时 S 中 未 被 覆盖 的 元 素 个 数 , 即 w 王 |S| 。 进 一 步 设 是 数列 wo za ,ws，… 中 
第 一 个 等 于 0 的 下 标 。 那 么 ,S 中 的 元 素 被 集合 S, ,Ss,…,S 所 覆盖 , 且 wu;_1 之 u,S 中 有 
ui-1 一 Ui 个 元 素 被 S; 第 一 次 覆盖 ,i 二 1,2,…,k&。 由 此 可 得 
二 
Ul 一 1 
TU 

由 算法 的 贪心 选择 性 质 可 知 ,S 所 覆盖 的 新 元 素 不 会 比 S; 多 ,否则 算法 将 选择 集合 S 

而 不 是 S;。 因 此 ， 
| Si:—(S, U S; U we U Si1) | 之 | SS 一 (SS U S: U RS U S.-i1) |= zi 一 1 

由 此 可 知 ， 


大 


> < Ul Ui 


ES = Wi-l 


对 于 任意 正 整数 a 和 4b, 且 a<6b, 容 易 证 明 


1、 5— 
H(W)—H(a) = = 


i=atl 工 b 
利用 这 个 不 等 式 得 到 
3 
Ce Ul Ui 
< PH) — HO)) 
i=1 
= H(u) — HG) 
= H(u) — H(O0) 
= H(u) 
=H(| S|) 
这 就 是 要 证 明 的 不 等 式 。 


容易 证 明 对 于 任 一 正 整 数 n 有 HH(n) 三 lnn 十 1。 由 于 max( 1S1} 三 |X|1, 故 H(max 
{1S1)) 和 In|X| 十 1。 因 此 ,也 可 以 说 ,算法 greedySetCover 的 性 能 比 为 In|X| 十 1。 

在 许多 实际 应 用 中 max {| S|} 是 一 个 小 常数 , 因此 ,在 这 种 情况 下 ， 由 算法 
greedySetCover 计 算出 的 近似 最 优 集合 覆盖 的 大 小 只 不 过 是 最 优 集合 覆盖 的 大 小 的 一 个 小 
常数 倍 。 例 如 , 当 一 个 图 的 顶点 度数 最 多 为 3 时 ,用 算法 greedySetCover 解 关于 这 个 图 的 
顶点 覆盖 问题 ,可 得 到 一 个 近似 最 优 的 顶点 覆盖 ,其 性 能 比 为 日 (3) 二 11/6。 这 比 算法 
approxVertexCover 得 到 的 结果 稍 好 些 。 


8.8 子 集 和 问题 的 近似 算法 


设 子 集 和 问题 的 一 个 实例 为 (S,z)。 其 中 ,S={ziyz,…yzo) 是 一 个 正 整数 的 集合 
是 一 个 正 整 数 。 子 集 和 问题 判定 是 否 存在 S 的 一 个 子 集 S1 ,使 得 >) x 一 +。 


ES1 
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该 问题 是 一 个 NP 完全 问题 。 在 实际 应 用 中 , 常 遇 到 最 优化 形式 的 子 集 和 问题 。 在 这 。 
种 情况 下 ,要 找 出 S 的 一 个 子 集 S1 ,使 得 其 和 不 超过 +, 又 尽 可 能 地 接近 +。 例 如 ,在 第 5 章 章 


中 讨论 过 的 最 优 装载 问题 实质 上 是 最 优化 形式 的 子 集 和 问题 。 
下 面 先 提出 解 最 优化 形式 的 子 集 和 问题 的 指数 时 间 算 法 ,然后 对 这 个 算法 做 适当 修改 ， 
使 它 成 为 解 子 集 和 问题 的 完全 多 项 式 时 间 的 近似 格式 。 


8.8.1 子 集 和 问题 的 指数 时 间 算 法 


设 工 是 一 个 由 正 整 数组 成 的 表 ,z 是 另外 一 个 正 整 数 。 用 荆 十 z 表示 对 表 工 中 每 个 整 
数 加 上 z 后 得 到 的 新 表 。 例 如 ,车 L=(1,2,3,5,9), 则 工 十 2 二 (3,4,5,7,11)。 对 于 整数 集 
合 S, 也 用 记号 S 十 z 表示 集合 S 中 每 个 元 素 都 加 上 z, 即 S 十 x=={s 十 xz1sE€S})。 

下 面 要 描述 的 解 子 集 和 问题 的 算法 exactSubsetSum 以 集合 S 二 {zi zz，…,zo} 和 目标 
值 : 作 为 输入 。 算 法 中 用 到 将 两 个 有 序 表 L1 和 L2 合并 成 为 一 个 新 的 有 序 表 的 算法 
mergeLists(L1,L2)。 与 合并 排序 算法 中 用 到 的 Merge 算法 类 似 , 算 法 mergeLists 的 计算 
时 间 为 OUL1| 十 |L21)。 

int exactSubsetSum (S,t) 

{ 
int n= |S|; 
L[L0J]={0)}; 
for (int i 王 1;i< 一 nii 十 十 ) { 
L[i]=mergeLists(L[i—1],L[i—1]+S[i]); 
删 去 L[ 让 中 超过 t 的 元 素 ; 
} 


return max(L[n]); 


} 
用 已 表示 {zi1,xs，… ,zi} 的 所 有 可 能 的 子 集 和 , 即 P; 中 的 一 个 元 素 是 {x ,x ，… ,zi) 
的 一 个 子 集 和 。 约 定 一 个 空 集 的 子 集 和 为 0, 并 约定 Po 二 10)}。 不 难 用 数学 归纳 法 证 明 
P; = Pias U (Pra tn) i= 1,2,."",n 
例如 , 若 S={1,4,5), 则 


P, = {0} 
P, = {0,1} 
P, = {0,1,4,5} 


P; = {0,1,4,5,6,9,10} 
由 此 易 知 ,算法 exactSubsetSum 中 的 表 工 [ 疏 是 一 个 包含 了 P; 中 所 有 不 超过 + 的 元 素 
的 有 序 表 。 因 此 ,L[n] 中 的 最 大 元 素 max(L[nj) 就 是 S 中 不 超过 + 的 最 大 子 集 和 。 
由 于 已 中 包含 了 所 有 可 能 的 {zi ,zz，…,zi) 的 子 集 和 ,因此 ,|P;|==2'。 在 最 坏 情况 
下 ,L[] 可 能 与 P; 相同 。 因 此 ,在 最 坏 情况 下 ,1L[i]|= 二 2+:。 由 此 可 知 ,在 一 般 情况 下 ,算法 
exactSubsetSum 是 一 个 指数 时 间 算 法 。 


8.8.2 子 集 和 问题 的 完全 多 项 式 时 间 近 似 格 式 
基于 算法 exactSubsetSum, 通 过 对 表 L[ 门 做 适当 的 修整 建立 一 个 子 集 和 问题 的 完全 多 
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项 式 时 间 近 似 格式 。 在 对 表 L[ 门 进行 修整 时 ,用 到 一 个 修整 参数 6,0 二 6 二 1。 用 参数 65 修 
整 一 个 表 工 是 指 从 工 中 删 去 尽 可 能 多 的 元 素 ,使 得 每 一 个 从 工 中 删 去 的 元 素 y ,都 有 一 个 
修整 后 的 表 L1 中 的 元 素 x 满足 (1 一 60)y 三 x 三 y。 可 以 将 x 看 作 是 被 删 去 元 素 y 在 修整 后 
的 新 表 工 1 中 的 代表 。 也 就 是 说 ,对 每 一 个 删 去 元 素 y, 可 以 用 新 表 工 中 一 个 元 素 < 来 代表 
y ,使 得 > 相对 于 y 的 相对 误差 不 超过 6。 
例如 ,车 86=0.1, 且 工 ==(10,11,12,15,20,21,22,23,24,29) , 则 用 6 对 L 进行 修整 后 得 
到 工 1 一 (10,12,15,20,23,29)。 其 中 ,被 删 去 的 数 11 由 10 来 代表 ,21 和 22 由 20 来 代表 ， 
24 由 23 来 代表 。 
经 修整 后 的 新 表 L1 中 的 元 素 也 是 原 表 工 中 的 元 素 。 对 一 个 表 进 行 修整 后 ,可 大 大 减 
少 其 中 的 元 素 个 数 ,而 对 每 个 被 删除 的 元 素 保 留 一 个 与 其 很 接近 的 代表 ,以 控制 计算 结果 的 
相对 误差 。 
下 面 的 算法 trim 对 有 序 表 工 进行 修整 , 它 以 有 序 表 工 = 《yi ,yw ,…,yn) 作 为 输入 ,中 
元 素 以 非 减 次 序 排列 。 
List trim(L,6) 
{ 
int m= |L|; 
Ll=(L[1]); 
int last=L[1]; 
for (int i 一 2;i< 一 mii 十 十 ) { 
if (last<(1—8) * LL) { 
将 工 [ 口 加 入 表 LI 的 尾部 ; 
last=L[i]; 
} 


return Ll; 


上 


在 算法 trim 中 ,以 递增 的 次 序 逐 个 扫描 表 工 中 元 素 。 当 被 扫描 元 素 是 表 工 中 第 一 个 元 素 
或 被 扫描 元 素 不 能 用 最 近 加 入 新 表 工 的 元 素 last 代表 时 ,将 被 扫描 元 素 加 入 新 表 L1 的 尾部 。 
而 能 够 被 last 代表 的 元 素 不 加 入 L1, 意 味 着 该 元 素 被 删 去 。 算 法 trim 的 计算 时 间 为 0(m)。 

由 算法 trim 可 构造 子 集 和 问题 的 近似 格式 approxSubsetSum 如 下 。 该 近似 格式 的 输 
入 参数 是 个 整数 的 集合 S 二 {zi ,zo，… ,zx,)\ 目 标 整数 t 和 一 个 近似 参数 e, 其 中 0 天 es 一 1。 


int approxSubsetSum(S,t,e) 
{ 
n=|S|; 
L[L0J]=(0); 
for (int i=1;i<—n;i++) { 
L[i]=merge(L[i—1],L[i—1j+S[i); 
L[i]=trim(L[i],e/m); 
删 去 L[ 记 中 超过 t 的 元 素 ; 
} 


return max(L[n]); 
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在 上 述 算法 中 ,首先 将 工 [0] 初 始 化 为 只 含 一 个 0 元 素 的 表 。 然 后 在 算法 的 主 循环 中 逐 
次 计算 表 工 [让 ,一 1,2,…,2。 计 算出 的 表 工 [可 实际 上 就 是 对 集合 P; 进行 修整 后 的 有 序 
表 , 修 整 参数 为 6=s/n。 另 外 .L[ 疏 中 已 将 超过 目标 整数 1 的 元 素 及 时 删除 ,以 减少 不 必要 
的 计算 。 

下 面 用 一 个 例子 来 说 明 approxSubsetSum 的 运行 情况 。 在 该 例 中 ,S 二 (104,102,201， 
101) ,t 二 308,e 二 0.2。 由 算法 确定 的 修整 参数 8 是 e/4 二 0.05。 初 始 时 ,L[0] 二 (0，;。 在 算 
法 的 主 循环 中 逐次 计算 出 L[1],L[2],LL3] 和 LL[4]。 每 次 计算 经 过 合并 ,修整 和 删除 大 于 + 的 
元 素 3 个 阶段 。 现 将 算法 计算 工 [ 门 (其 中 i==1,2,3,4) 的 3 个 阶段 的 计算 结果 列 出 如 下 : 


=(0,104); 

=(0,104); 

=(0,104); 
=(0,102,104,206); 
=(0,102,206); 
=(0,102,206); 
=(0,102,201,206,303,407); 
=(0,102,201,303,407); 
=(0,102,201,303); 
=(0,101,102,201,203,302,303,404); 
=(0,101,201,302,404); 
=(0,101,201,302); 


CECECEECECCECCC 


I 
1 
1 
2 
2 
[2 
[3 
[3 
[3 
[4 
[4 
[4 


算法 最 后 返回 一 302 作为 近似 解答 。 容 易 看 出 该 例 的 最 优 解 为 104 十 102 十 
101 二 307。 近 似 解 的 相对 误差 在 2% 以 内 。 在 理论 上 ,算法 可 以 保证 对 子 集 和 问题 的 任 一 
实例 ,其 相对 误差 在 es 之 内 。 

下 面 进一步 讨论 算法 approxSubsetSum 的 性 能 。 通 过 分 析 可 以 得 出 如 下 结论 ; 

(1) 算法 approxSubsetSum 计算 出 的 近似 解 是 S 的 一 个 子 集 和 , 它 关 于 最 优 解 的 相对 
误差 不 超过 预先 给 定 的 误差 界 e。 

(2) 算法 approxSubsetSum 是 子 集 和 问题 的 一 个 完全 多 项 式 时 间 近 似 格式 , 即 它 的 计 
算 时 间 是 关于 输入 规模 和 1/e 的 多 项 式 。 

首先 注意 到 ,算法 中 对 工 [ 门 进行 修整 ,并 将 其 中 超过 的 元 素 删 去 后 ,L[ 门 中 每 个 元 素 
仍 为 集合 P; 的 成 员 。 因 此 ,算法 返回 的 = 值 是 P, 的 成 员 , 从 而 它 是 S 的 一 个 子 集 和 。 若 


设 子 集 和 问题 的 最 优 值 为 ” , 则 算法 返回 的 近似 最 优 值 > 与 c* 一 1 一 


Es 要 证 明 这 个 相对 误差 不 超过 e 即 1 一 x/c* 三 e。 这 等 价 于 x 宇 (1 一 e) c" 。 注 意 到 在 对 


L[ 避 进行 修整 时 ,被 删除 元 素 与 其 代表 元 素 的 相对 误差 不 超过 e/n。 对 修整 次 数 i 用 数学 归 
纳 法 容易 证 明 ,对 于 P; 中 任 一 不 超过 + 的 元 素 y, 有 上 [i 中 一 个 元 素 xz, 使 得 (1 一 e/n)'y 三 
ZX 三 y。 由 于 最 优 值 c”E P, , 故 存在 zEL[Ln], 使 得 (1 一 e/n)"c* 三 x 三 c* 。 又 因为 算法 返回 
的 是 L[nj 中 最 大 元 素 z, 故 有 z 委 z 委 c” 。 因 此 , (1 一 e/n)"c* 二 zc* 。 最 后 ,由 于 (1 一 e/ 
n)" 是 nn 的 递增 函数 ,因此 , 当 n 记 1 时 ,有 (一) 二 (1 一 e/n)"。 由 此 可 得 , (1 一 e)c* 三 zx 过 
c*”。 这 就 证 明了 算法 approxSubsetSum 返回 的 近似 最 优 值 x 关于 最 优 值 .* 的 相对 误差 不 


Oo 
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超过 e。 

从 算法 approxSubsetSum 的 循环 体 可 以 看 出 ,每 次 对 有 序 表 LL[ 引 所 做 的 合并 ,修整 和 
删除 超过 z 的 元 素 的 计算 时 间 为 O(CILL]1)。 因 此 ,整个 算法 的 计算 时 间 不 会 超过 
O(n|L[n]1)。 注 意 到 算法 对 表 工 [ 疏 进 行 修整 后 , 表 中 相继 元 素 a 和 2 间 满 足 c/>1/(1 一 
s/72) 。 也 就 是 说 , 表 工 [ 右 相 继 元 素 间 至 少 相差 一 个 比例 因子 1/(1 一 e/n)。 而 表 [如 中 最 大 
数 不 会 超过 +。 因此 ,算法 完成 了 对 工 [ 右 的 合并 、 修 整 和 删除 超过 : 的 元 素 等 操作 后 , 工 [ 门 中 
元 素 个 数 不 超 过 

lnt lnt 一 上 nt 
ln(1/(1—e/n)) 一 jn(1 一 se/z) ~e/n € 
特别 地 ,|L[o]| 近 对。 于 是 ,算法 approxSubsetSum 的 计算 时 间 为 Oo/e) ,这 表明 它 


是 一 个 完全 多 项 式 时 间 近 似 格 式 。 


小 结 


问题 的 计算 复杂 性 可 以 通过 解决 该 问题 所 需 的 计算 量 来 刻画 。 通 常 将 可 在 多 项 式 时 间 
内 解决 的 问题 看 作 是 “ 易 " 解 问题 ,而 将 需要 指数 函数 时 间 解 决 的 问题 看 作 是 “ 难 ” 解 问题 。 
本 章 讨论 的 NP 类 问题 的 计算 复杂 性 状况 至 今 未 知 。 许 多 现象 说 明 这 类 问题 可 能 是 “ 难 ” 解 
的 。 在 NP 类 问题 中 ,NP 完全 问题 类 构成 了 NP 类 问题 的 核心 。 它 们 也 许 是 NP 类 中 最 难 
的 问题 ,其 困难 性 体现 在 任何 一 个 NP 类 问题 可 以 在 多 项 式 时 间 内 变换 为 一 个 NP 完全 问 
题 。 本 章 在 介绍 NP 类 问题 之 前 引入 非 确定 性 图 灵机 的 概念 。NP 完全 问题 的 概念 和 Cook 
定理 是 本 章 的 核心 。 在 Cook 定理 的 基础 上 ,通过 一 些 典型 的 NP 完全 问题 ,如 合 取 范式 的 
可 满足 性 问题 . 团 问 题 ,顶点 覆盖 问题 子 集 和 问题 .哈密 顿 回路 问题 ,旅行 售货员 问题 等 , 介 
绍 了 研究 NP 完全 问题 的 方法 与 技巧 。 本 章 还 讨论 了 解 NP 完全 问题 的 近似 算法 。 迄 今 为 
止 , 所 有 的 NP 完全 问题 都 还 没有 多 项 式 时 间 算 法 。 对 于 规模 较 大 的 NP 完全 问题 通常 可 
用 近似 算法 求解 。 本 章 着 重 介绍 了 近似 算法 的 性 能 比 及 多 项 式 时 间 近 似 格 式 等 概念 。 针 对 
一 些 常 见 的 NP 完全 问题 ,如 顶点 覆盖 问题 .旅行 售货员 问题 ,集合 覆盖 问题 和 子 集 和 问题 
等 ,讨论 了 近似 算法 的 设计 与 分 析 方 法 。 


习 题 


8-1 证 明 析 取 范式 的 可 满足 性 问题 属于 P 类 。 

8-2 ”2-SAT 是 每 个 合 取 项 恰 有 两 个 因子 的 可 满足 性 问题 。 证 明 2-SATEP, 并 提出 解 此 问 
题 的 尽 可 能 高 效 的 算法 。 

8-3 ”给 定 一 个 mXn 整数 矩阵 4 和 一 个 m 元 整数 向 量 b ,判定 是 否 存在 一 个 元 0-1 向 量 
x, 使 得 Ax 三 b。 该 问题 称 为 0-1 整数 规划 问题 。 证 明 该 问题 是 NP 完全 问题 。( 提 
示 : 证 明 3-SATec,0-1 整数 规划 问题 。) 

8-4 给 定 整数 集合 ,判定 S 是 否 可 划分 为 两 个 子 集 A 和 有 (一 S 一 A) ,使 得 >)x= 》) x。 


zxEA EA 
证 明 该 问题 是 NP 完全 问题 。 
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8-5 最 长 简单 回路 问题 是 确定 给 定 图 G==(V,E) 中 一 条 长 度 最 大 的 简单 回路 (其 中 没有 重 
复出 现 的 顶点 ) 的 问题 。 证 明 最 长 简单 回路 问题 是 NP 完全 问题 。 
8-6 设 问题 已 关于 实例 工 的 精确 解 为 c”(D , 解 问题 已 的 近似 算法 A 对 于 实例 I 得 到 的 
近似 解 为 c(D 。 如 果 存在 一 常数 ,使 得 对 于 PP 的 任何 实例 I 均 有 
le (DD=elD | 
则 称 算法 A 是 解 问题 已 的 绝对 近似 格式 。 
平面 图 的 色 数 问题 是 对 于 给 定 的 平面 图 G 二 (V,E) ,确定 对 其 顶点 着 色 的 最 小 色 数 。 
试 设计 解 平面 图 着 色 问 题 的 一 个 多 项 式 时 间 绝 对 近似 算法 A 使 得 
le*D—e(DI<1 
8-7 设 有 nn 个 程序 1,2,…,n 要 存 和 人 2 张 容量 为 maxM 的 磁盘 中 。 第 i 个 程序 需要 的 存储 
空间 为 mi,i 二 1,2,…,n。 设 计 一 个 算法 计算 出 这 2 张 磁盘 能 存放 的 最 多 程序 个 数 。 
(1) 证 明 上 述 问题 是 NP 难 的 ; 
(2) 下 面 的 算法 pStore 是 解 上 述 问题 的 一 个 绝对 近似 算法 。 
int pStore(int n, int maxM, int [] m) 
| 
sort(m,n); // 将 m 从 小 到 大 排序 
int i=1; 
for (int j=1;j<=2;j++) { 
int sum=0; 
while (sum+m[i]<= maxM) { 
System. out. println(” Store program "十 i 十 ”on disk’ 十 j); 
sum++=m[i]; 
if (i==n) return i; 
else i 十 十 3 
} 
} 


return i—1; 


} 


试 证 明 对 于 上 述 算 法 pStore, 有 |c* (D 一 c(D| 志 1。 

8-8 ”设计 一 个 有 效 的 贪心 算法 ,使 其 能 在 线性 时 间 内 找到 一 棵 树 的 最 优 项 点 覆盖 。 

8-9 解 顶点 覆盖 问题 的 一 个 启发 式 算 法 如 下 ,每 次 选择 具有 最 高 度数 的 顶点 ,然后 将 与 其 
关联 的 所 有 边 删 去 。 举 例 说 明 该 算法 的 性 能 比 将 大 于 2。 

8-10 ”图 G 的 最 优 项 点 覆盖 是 其 补 图 中 最 大 团 集 的 补 集 。 这 个 关系 是 否 暗 示 对 于 团 问 题 
也 有 一 个 常数 性 能 比 的 近似 算法 ? 

8-11 证 明 旅 行 售货员 问题 的 一 个 实例 可 在 多 项 式 时 间 内 变换 为 该 问题 的 另 一 个 实例 ,使 
得 其 费用 函数 满足 三 角 不 等 式 , 且 两 个 实例 具有 相同 的 最 优 解 。 说 明 是 否 可 以 通过 
这 个 变换 使 得 一 般 的 旅行 售货员 问题 具有 一 个 常数 性 能 比 的 近似 算法 。 

8-12 瓶颈 旅行 售货员 问题 是 要 找 出 图 G 的 一 条 哈密 顿 回路 , 且 使 回路 中 最 长 边 的 长 度 最 
小 。 若 费用 函数 满足 三 角 不 等 式 , 给 出 解 此 问题 的 性 能 比 为 3 的 近似 算法 。( 提 示 : 
递归 地 证 明 , 可 以 通过 对 G 的 最 小 生成 树 进行 完全 遍历 并 跳 过 某 些 顶点 ,但 不 能 跳 
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过 多 于 2 个 连续 的 中 间 顶 点 ,以 此 方式 访问 最 小 生成 树 中 每 个 顶点 恰好 一 次 。) 

若 旅 行 售货员 问题 中 ,图 G 的 各 顶点 均 为 平面 上 的 点 , 且 费 用 函数 c(u.v) 定 义 为 点 
u 和 w 之 间 的 欧 几 里 得 距离 ,证 明 G 的 最 优 旅 行 售货员 回路 不 会 自 相交 。 

试 给 出 一 族 集合 覆盖 问题 的 实例 ,用 以 说 有 算法 greedySetCover 可 以 产生 的 不 同 解 
的 个 数 随 实例 规模 的 指数 增长 。 这 里 所 说 的 不 同 解 是 指 算法 greedySetCover 在 做 
贪心 选择 时 可 以 有 多 种 选择 ,即使 |1SNU | 最 大 的 子 集 可 有 多 个 时 ,不 同 的 选择 导致 
算法 的 不 同 的 解 。 

多 机 调度 问题 : 设 有 m 台 完 全 相同 的 机 器 完成 个 彼此 独立 的 任务 ,第 i 个 任务 所 
需 的 机 器 时 间 为 ti,i 二 1,2,…,n。 要 确定 一 个 时 间 表 ,使 全 部 n 个 任务 都 结束 的 时 
间 最 短 。 

解 上 述 问 题 的 最 长 处 理 时 间 算 法 LPT 每 次 从 待 安排 任务 中 选择 最 长 处 理 时 间 的 任 
务 ,并 安排 给 一 台 完 全 空闲 机 器 。 试 在 O(nlogn) 时 间 内 实现 算法 LPT, 并 证 明 该 算 


法 所 得 到 的 解 的 相对 误差 4 二 产业 = 此 


3 3m” 


es 3 
c* 


LPT 算法 的 最 坏 情 况 实例 : 设 n= 二 2m 十 1 且 4=2m-| 邯 } 


试 构 造 多 机 调度 问题 关于 该 实例 的 最 优 解 。* 和 用 算法 LPT 求 出 的 解 c, 并 计算 近似 
算法 LPT 的 性 能 比 y= | 一 二 


- 

设 在 多 机 调度 问题 中 ,要 在 所 给 加 台 机 器 上 安排 的 n 个 任务 已 按 各 自 所 需 处 理 时 间 

的 递减 序列 排列 4 宇 4 三 … 宇 1,。 解 此 问题 的 算法 LPT2 先 确定 一 个 正 整数 ,对 前 

个 任务 求 最 优 安排 ,然后 对 后 一 个 任务 用 算法 LPT 求解 。 

(1) 试 证 明 算法 LPT2 的 解 的 相对 误差 < 

(2) 根据 (1) 的 结论 ,设计 一 个 解 多 机 调度 问题 的 多 项 式 时 间 近 似 算法 ,对 于 给 定 的 
e0, 算 法 所 需 的 计算 时 间 为 O(nlogn 十 m™*)。 


1<i<2m, mn =m。 


第 9 章 
串 与 序列 的 算法 


串 与 序列 的 算法 是 计算 机 科学 领域 的 经 典 研究 课题 。 尤 其 是 在 高 速 互联 网 ,大 数据 与 
云 计算 以 及 人 工 智能 已 经 上 升 为 国家 战略 性 新 兴 产 业 的 新 时 代 , 串 与 序列 的 算法 的 发 展 与 
应 用 更 显示 出 勃勃 生机 。 在 生物 信息 学 .信息 检索 .语言 翻译 ` 数 据 压 缩 `, 网 络 人 侵 检 测序 
列 模式 挖掘 等 诸多 具有 挑战 性 的 前 沿 科学 领域 中 , 串 与 序列 的 算法 都 扮演 着 关键 角色 。 应 
用 高 效 的 串 与 序列 的 算法 将 是 推进 和 提高 这 类 先进 系统 总 体 性 能 的 重要 手段 。 


9.1 子 串 搜索 算法 


子 串 搜索 算法 是 串 运 算 中 使 用 频繁 的 算法 。 在 深入 讨论 串 与 序列 的 算法 之 前 , 先 介绍 
串 的 基本 概念 。 


9.1.1 串 的 基本 概念 


下 面 介绍 有 关 串 的 基本 概念 。 
(1) 串 : 也 称 字符 串 , 是 有 限 字 符 集 三 中 的 0 个 或 多 个 字符 组 成 的 有 限 序列 。 一 般 
记 为 
s 一 sL0]sL1]…s[2 一 1 
其 中 ,s 是 串 名 。;[ 门 ,0 三 in 一 1 是 有 限 字 符 集 5 中 的 字符 。 
(2) 串 中 字符 的 个 数 n 称 为 串 的 长 度 , 记 为 |s|。 
(3) 0 个 字符 的 串 , 即 长 度 为 0 的 串 , 称 为 空 串 , 记 为 E 。 
(4) 字符 集 研 上 的 所 有 串 组 成 的 集合 记 为 了 " 。 
(5) 当 s 关 E 时 , 串 中 字符 [让 ,0<i 生 zx 一 1 的 下 标 i 一 0,1,…,|s| 一 1 称 为 该 字符 在 串 
中 的 位 置 。 因 此 , 串 中 第 i 个 字符 的 位 置 是 i 一 1。 
(6) 在 串 * 中 出 现 的 字符 的 集合 记 为 alph(s)。 
例如 , 若 * 王 abaaab, 则 |s*| 王 6, 且 alph(s) 一 {fa:b)}。 
(7) 两 个 串 zx 和 y 的 连接 zy 是 将 串 y 接 在 串 xz 之 后 得 到 的 串 ,也 称 为 串 工 和 >y 的 乘积 。 
(8) 对 于 任何 串 s 和 非 负 整数 z,s 的 震 s" 可 递归 地 定义 为 
=€ 
下 到 多 3 上 
(9) 串 s 的 逆 串 也 称 为 镜像 , 记 为 ;7 . 它 是 将 串 s 反 转 得 到 的 串 
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s=s|s|—1]s[|s|— 2]-……s[L0] 
(10) 设 z 和 yy 是 两 个 串 。 当 


Iz1|=|y| 
2 era 

时 , 称 这 两 个 串 是 相等 的 , 记 为 x 二 y。 对 于 任何 字符 a,zx= 二 y 当 且 仅 当 za 二 ya。 

(11) 设 z 和 y 是 两 个 串 。 若 有 另外 两 个 串 wx 和 w ,使 得 y= 二 wrv, 则 称 串 zx 是 串 y 的 一 
个 子 串 。 也 就 是 说 , 子 串 zx 是 由 串 > 中 任意 个 连续 的 字符 组 成 的 子 序列 。 串 > 中 从 y[ 门 开 
始 到 y[ 门 结束 的 连续 j 一 i 十 1 个 字符 组 成 的 子 串 记 为 y[i. . 门 。 当 这 时 ,y[.. 门 =E。 

特别 地 , 当 二 E 时 , 称 z 是 y 的 一 个 前 级 , 记 为 x y; 当 v=€E 时 , 称 z 是 y 的 一 个 后 
级 , 记 为 x y。 例 如 ,abc abcca,cca abcca。 当 x y 时 ,显然 有 |zx| 三 |y|。 空 串 E 是 任 
何 一 个 串 的 前 级 和 后 级 。 

(12) 当 非 空 串 工 是 > 的 子 串 时 , 称 z 在 y 中 出 现 。 一 般 情况 下 ,z 可 能 在 > 中 多 处 出 
现 。 当 y[i..i 二 lz| 一 1]=z 时 , 称 z 在 y 的 位 置 i 处 出 现 。 位 置 i 称 为 z 在 y 中 的 左 端 ， 
位 置 i 十 |z| 一 1 称 为 zx 在 y 中 的 右 端 。 

例如 , 当 y= 二 bababababa 且 z= 二 abab 时 ,zx 在 y 中 出 现 的 位 置 如 图 9-1 所 示 。 


i 0 1 2 3 4 5 6 7 8 9 
y[ 订 b a b a b a b a b a 
左 端 1 3 5 

右 端 4 6 8 


图 9-1 z 在 y 中 出 现 的 位 置 


(13) 子 串 搜索 ,又 称 串 匹配 ,是 关于 串 的 最 重要 的 基本 运算 之 一 。 

对 于 给 定 的 长 度 为 的 主 串 1[0..n 一 1] 和 长 度 为 m 的 模式 串 p[0..m 一 1j,m 二 nn, 子 
串 搜 索 运 算 就 是 找 出 p 在 t 中 出 现 的 位 置 。 

(14) 简单 子 串 搜索 算法 的 基本 思想 是 : 从 主 串 1 的 第 一 个 字符 起 和 模式 串 p 的 第 一 个 
字符 进行 比较 。 若 相等 则 继续 逐个 比较 后 续 字符 ,否则 从 + 的 第 二 个 字符 起 继续 和 pp 的 第 
一 个 字符 进行 比较 。 以 此 类 推 ,直至 p 中 的 每 个 字符 依次 和 + 中 的 一 个 子 串 中 字符 相等 ,此 
时 搜索 成 功 ,否则 搜索 失败 。 

简单 子 串 搜索 算法 可 描述 如 下 : 


public int search(String t, String p) 
{// 简 单子 串 搜索 算法 

int m 一 p. length(); 

int n=t. length(); 


while(i< 一 n 一 m){ 
int j 一 0; 
while(Gj<m && t. charAt(i+j)==p. charAt(j))j 十 十 
if(j==m) return i; // 找 到 
10 i 


1 
2 
3 
4 
5 int i=0; 
6 
7 
8 
9 
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让 } 
12 returnn; // 未 找到 


例如 , 设 主 串 :一 ababcabcacbab ,模式 串 p 二 abcac。 用 简单 子 串 搜索 算法 搜索 p 在 t 中 
出 现 的 位 置 的 过 程 如 图 9-2 所 示 。 


基 2 


II 


9-2 简单 子 串 搜索 算法 


在 简单 子 串 搜索 算法 中 ,2 重 循环 在 最 坏 情况 下 需要 O((n 一 m)m) 时 间 。 因 此 ,简单 子 
串 搜索 算法 需要 O(n 一 m)m) 时 间 。 
9.1.2 KMP 算法 


KMP 算法 是 由 Knuth,Pratt 和 Morris 提出 的 一 个 高 效 的 子 串 搜索 算法 ,所 需 的 计算 
时 间 为 Ol(m 十 n)。 由 此 可 知 ,简单 子 串 搜 索 算法 不 是 最 优 算法 。KMP 算法 是 在 简单 子 串 
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搜索 算法 思想 的 基础 上 ,进一步 改进 搜索 策略 得 到 的 。 简 单子 串 搜索 算法 效率 不 高 的 主要 
原因 是 ,没有 充分 利用 在 搜索 过 程 中 已 经 得 到 的 部 分 匹配 信息 。 而 KMP 算法 正 是 在 这 一 
点 上 对 简单 子 串 搜索 算法 做 了 实质 性 的 改进 。 在 KMP 算法 中 , 当 出 现 字符 比较 不 相等 时 ， 
能 够 利用 已 经 得 到 的 部 分 匹配 结果 ,将 模式 串 向 右 滑动 尽 可 能 远 的 一 段 距离 后 继续 进行 比 
较 。 下 面 先 来 看 一 个 具体 例子 。 在 图 9-2(c) 中 , 当 i 二 6,j 二 4 时 ,字符 比较 不 相等 。 此 时 ， 
又 从 i=3 和 j==0 重新 开始 比较 。 然 而 从 图 9-2(c) 的 部 分 匹配 中 ,已 经 知道 主 串 中 位 置 3， 
4,5 处 的 字符 分 别 为 b,c 和 a。 因 此 ,在 i=3 和 j==0,i=4 和 j=0 以 及 i=5 和 j==0 这 3 次 
比较 都 是 不 必要 的 。 此 时 ,只 要 将 模式 串 向 右 滑动 3 个 字符 的 位 置 ,继续 进行 i=6 和 j=1 
处 的 字符 比较 即 可 。 同 理 ,在 图 9-2(a) 中 发 现 字 符 不 相等 时 ,只 要 将 模式 串 向 右 滑动 两 个 
字符 的 位 置 ,继续 进行 ;一 2 和 7 一 0 处 的 字符 比较 。 由 此 可 知 ,在 整个 搜索 过 程 中 ,不 会 产 
生 搜索 的 回溯 ,如 图 9-3 所 示 。 


a 
中 | 类 
C 


alblalblclalblelalclblajlpe 
| ee 
[La[b[e[aTe 


(©) 
图 9-3 KMP 算法 的 搜索 过 程 


在 一 般 情况 下 , 设 主 串 为 苞 0. .一 ,模式 串 为 p[0..m 一 1j,m 三 n。 子 串 搜索 问题 就 
是 要 找到 0 三 i 二 n 一 m, 使 得 t[i..i+m 一 1]==p[0..m 一 1]。 
在 KMP 算法 中 的 一 个 关键 的 问题 是 : 已 知 p[0. .gj==t[i. .i 十 qj, 确定 
p[Lo..k] = [i’..i 二 kJ (9.1) 
且 字 十 一 :十 4 成 立 的 最 小 移动 位 置 i 之 i。 这 个 最 小 的 移动 位 置 i 保证 了 在 它 前 面 的 位 置 
都 是 无 效 匹 配 。 在 最 好 情况 下 有 ==i 十 gq, 此 时 在 位 置 i,i 十 1,… ,i 十 g 一 1 都 不 可 能 产生 有 
效 匹配 。 因 此 ,不 论 在 什么 情况 下 ,由 于 从 式 (9.1) 已 知 在 位 置 i 前 & 个 字符 的 匹配 情况 , 因 
此 不 必 再 比较 这 上 个 字符 。 这 些 必要 的 信息 可 以 通过 对 模式 串 p 自身 进行 比较 预先 计算 出 
来 。 事 实 上 ,t[i'..i 十 k] 是 主 串 中 已 经 知道 的 部 分 , 它 是 p[0.. gj 的 一 个 后 经。 因此 
式 (9.1) 也 可 解释 为 求 最 大 的 &<g, 使 得 pL0. .kj 是 pL0..gj 的 一 个 后 级 。 由 当 k<g 时 ， 
pL0..&j 是 pL0. .gj 的 一 个 真 前 级 。 因 此 ,也 可 以 说 式 (9.1) 要 确定 pL0. .gj 的 一 个 最 大 真 
前 级 使 其 也 是 一 个 后 级。 确定 出 这 样 的 后 ,下 一 个 可 能 的 有 效 移动 位 置 就 是 i 二 i 十 gq 一 k。 
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KMP 算法 就 是 利用 这 个 信息 来 改进 简单 子 串 搜索 算法 的 。 为 此 需要 引入 模式 串 p[0.. 4 
m 一 1] 的 前 级 函数 next 如 下 。 章 


定义 9.1 对 于 给 定 的 模式 串 pL0..m 一 1], 其 前 级 函数 next 定义 为 
next(g) = max_i<k<v{& | pLO0..k] pLo0..g]} (9.2) 
图 9-4 是 关于 模式 串 ababababca 的 前 级 函数 的 例子 。 


i |o|1|: 4|5[6[7|s|o 
0 alblalbla | bljalblcla 
next 由 | -1 -oil2|3|4|sPlo 


9-4 模式 串 ababababca 的 前 缀 函数 


通过 上 面 的 分 析 可 知 ,模式 串 的 前 级 函数 将 大 大 地 提高 了 简单 子 串 搜索 算法 的 效率 。 
由 此 可 得 到 改进 后 的 子 串 搜 索 算 法 ,KMP 算法 如 下 : 


public void KMP_Matcher( String t) 
{//KMP 算法 

int m 一 p. length()， 

int n=t. length(); 


for(int i=0;i<n;it+)1{ 
while(j>—1 &8& p.charAt(j+1)!=t. charAt(i))j 一 next[j]， 


1 
2 

3 

4 

5 intj=—1; 
6 

7 

8 if(p. charAt(j+1) ==t. charAt(i))j 十 十 ， 
9 


让 (j = 一 m 一 1)return i 一 m 十 1; // 找 到 
10  ) 
ll returnn; // 未 找到 
12 } 


在 用 算法 KMP-Matcher 搜索 之 前 ,需要 先 计算 模式 串 p 的 前 级 函数 next。 

算法 中 比较 字符 p[j 十 1j 与 t[ 门 时 可 能 出 现 3 种 不 同情 形 。 

(1) 情形 一 : p[j 十 1]=z[]。 

此 时 i 和 j 均 增 1, 继 续 比 较 下 一 对 字符 pL[j 十 2] 和 +t[i 十 1]。 

(2) 情形 二 : pLj 十 1] 才 1[i 且 7) 全 一 1。 

此 时 i 不 变 , 位 置 j 退 到 next[ 门 ,; 即 模式 串 p 向 右 滑 动 j 二 next[j] 个 位 置 ,继续 比较 
pLi 十 1 与 t[ 记 。 

(3) 情形 三 : p[j 十 1J 取 [i] 且 j= 一 1。 

此 时 i 增 1,j 不 变 , 继 续 比 较 pL0] 和 t[i 十 1]。 

从 算法 KMP-Matcher 中 可 以 看 出 ,前 级 函数 next 的 移动 策略 是 KMP 算法 与 简单 子 
串 搜 索 算 法 的 唯一 不 同 之 处 。 因 此 ,从 前 级 函数 next 的 定义 以 及 简单 子 串 搜索 算法 的 正确 
性 ,可 以 得 到 KMP 算法 的 正确 性 。 

现在 考查 KMP 算法 所 需 时 间 。 除 了 计算 前 级 函数 next 所 需 时 间 外 ,算法 KMP- 
Matcher 的 主要 时 间 耗 费 在 于 其 while 循环 体 所 需 计 算 时 间 。 

设 在 算法 结束 时 =i 一 j。 事 实 上 ,k 就 是 算法 根据 前 级 函数 next 计算 出 的 滑动 距离 
的 总 和 。 在 算法 整个 执行 过 程 中 ,显然 有 kn。 
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算法 在 比较 字符 p[j 十 1] 与 世英 时 的 3 种 不 同情 形 中 ,出 现 情形 一 时 ,i 增 1,k 不 变 。 
出 现 情形 二 时 ,i 不 变 ,k 增 加 j 一 next[j]。 由 于 j 记 next[ 门 ,k 至 少 增加 1。 

出 现 情形 三 时 ,由 于 j 不 变 , 所 以 ; 增 1, 且 & 增 1。 由 此 可 见 ,while 循环 体 的 每 次 近 代 
使 得 i 或 & 至少 增 1。 因 此 ,while 循环 体 最 多 执行 了 2n 次 。 也 就 是 说 ,除了 计算 前 缀 函数 
next 所 需 时 间 外 ,KMP 算法 所 需 的 计算 时 间 为 O(n)。 

用 与 算法 KMP-Matcher 类 似 的 思想 ,可 以 设计 预先 计算 前 级 函数 next 的 算法 build 
如 下 : 


1 private void build(String p) 

2 {// 计 算 前 级 函数 

3 int m=p. length() ,j=—1; 

4 next[0]=—1; 

5 for(int i=1;i<=m—1;i++){ 
6 while(j>—1 && p. charAt(j+1)!=p. charAt(i))j=next[j]; 
if(p. charAt(j 十 1) 王 一 p. charAt(iD )j 十 十 ; 

8 next[i]=j; 

9 } 

10 } 


由 前 级 函数 的 定义 易 知 nextL0] 一 一 1。 对 于 任何 ) 一 0, 设 已 经 计算 出 next[0],next[1]， 
… ,next[i 一 1]。 在 while 循环 中 通过 比较 pL 十 1J 和 p[ 站 , 找 出 &0.. 菇 所 有 后 缀 中 最 大 的 真 
前 级 7。 此 时 ,如 果 zD 十 匡 二 加 宫 , 则 由 定义 可 知 next[ 让 一 ) 二 1; 否则 ,next[ 让 一 7 

通过 与 算法 KMP-Matcher 类 似 的 分 析 可 知 ,算法 build 的 while 循环 体 最 多 执行 了 2m 
次 。 因 此 ,预先 计算 前 级 函数 next 的 算法 build 所 需 计 算 时 间 为 OC(m) 。 

综合 可 知 , 在 最 坏 情况 下 ,KMP 算法 所 需 计 算 时 间 为 OC(m 十 nn)。 


9.1.3 Rabin-Karp 算法 


本 节 要 讨论 的 Rabin-Karp 子 串 搜索 算法 是 基于 串 散 列 函数 的 指纹 搜索 算法 。 其 基本 
思想 是 : 先 计算 模式 串 的 一 个 散 列 函 数 ,然后 用 此 散 列 函 数 在 主 串 中 搜索 与 模式 串 长 度 相 
同 且 散 列 值 相同 的 子 串 ,并 进行 比较 。 

称 Rabin-Karp 子 串 搜索 算法 为 指纹 搜索 算法 ,是 因为 它 只 用 了 少量 信息 ( 散 列 值 ) 来 表 
示 要 搜索 的 模式 串 。 因 此 ,模式 串 的 散 列 值 可 以 看 作 是 它 的 指纹 。 用 指纹 在 主 串 中 搜索 大 
大 提高 了 搜索 效率 。 

在 一 般 情况 下 ,可 以 用 一 个 大 小 为 g 的 散 列表 来 存储 字符 串 。 将 长 度 为 m 的 字符 串 看 
作 长 度 为 m 的 > 进 制 数 ,并 对 g 取 余 后 映射 为 LC0,g 一 1] 中 的 一 个 整数 。 

例如 ,将 p[ 让 ,Pp[i 十 1],…,pLi+m 一 1] 看 作 长 度 为 m 的 进 制 数 

Zi 二 pLijr 下 十 pi 十 1jr 下 十 … 十 p[i 十 mx 一 1jr (9.3) 

子 串 p[i. .i 十 m 一 1j 的 散 列 值 就 是 h(xi) 二 x; mod gq。 

对 于 给 定 的 + 和 g ,计算 子 串 p[i. .i 二 m 一 1] 的 散 列 值 的 算法 描述 如 下 : 


1 private long hash(String p,int i,int m) 
2 {// 计 算 子 串 的 散 列 值 
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3 long h=0; 第 
4 for(int j=0;j<m;j 二 二 )h= (Rx h 十 p. charAt(i 十 j))%q; 9 
s return h; 章 
6 } 


根据 这 个 串 散 列 函 数 ,可 以 将 简单 子 串 搜 索 算法 改进 如 下 : 


1 public int search(String t) 

2 1{//Rabin-Karp 算法 

名 int n=t. length(); 

4 long hp= hash(p,0,m); 

区 for(int i=0;i<=n—m;i++ ){ 
6 long ht=hash(t,i,m); 
7 if(hp== ht) return i; 
8 } 

9 Teturn n; 

10 } 


由 于 计算 子 串 的 散 列 值 比较 费时 ,还 不 如 直接 比较 字符 串 。 但 是 在 Rabin-Karp 子 串 搜 
索 算法 中 ,采用 滚动 散 列 技术 可 以 用 O(1) 时 间 计 算 子 串 的 散 列 值 ,从 而 使 其 在 平均 情况 下 
只 用 线性 时 间 就 可 以 完成 子 串 搜索 。 
事实 上 ,由 式 (9.3) 可 知 ,对 于 子 串 p[i 十 1. .i 十 mj, 有 
xi 三 p[i 十 1jr 下 十 p[i 十 2jr" 十 … 十 p[i 十 mjr? 
等 价 于 
Za = (zi— pliJr™ r+ plit+m—1] (9.4) 
由 此 可 知 ， 
h(zmn) = za modg 
= ((zi— pLijr "ri+p[lii+m—1]) modg 
(((zi— pLijr™!) mod Wri+plii+m—1]) modg 
= ((h(z) — plilr”! mod Dri+plii+m—1]) modg 
换 句 话说 ,已 知 h(zi) 的 值 ,可 以 用 O(1) 时 间 计 算出 h(zim) 的 值 。 
这 就 是 滚动 散 列 技术 的 基本 思想 。 据 此 可 以 将 简单 Rabin-Karp 子 串 搜索 算法 进一步 
改进 如 下 : 


1 public int search(String t) 

2 1{//Rabin-Karp 子 串 搜索 算法 

3 int n=t. length(); 

4 if(n<m)return n; 

5 long ht=hash(t,0,m); 

6 long hp=hash(p,0,m); 

7 if((hp==ht) && check(t,0))return 0; 
8 // 检 测 散 列 匹配 , 然后 检测 精确 匹配 

9 for(int ij 一 mi;i<n;i 十 十 ){ 

10 // 检 测 匹 配 

11 ht= (ht 十 q 一 RM * t. charAt(i—m) %q) %q; 
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12 ht 一 Chtx R 十 t charAt(i)) % qs; 

13 int offset 一 i 一 m 十 1; 

14 if((hp==ht) && check(t,offset))return offset; // 匹 配 
15 } 

16 returnn; // 不 匹配 
Ei 


算法 中 先 计算 模式 串 p 的 散 列 值 hp, 以 及 主 串 1 的 首 个 m 子 串 的 散 列 值 ht。 同 时 , 计 
算出 r”"' mod g 并 保存 于 rm 备用 。 然 后 比较 模式 串 的 散 列 值 hp 和 主 串 1 的 首 个 mm 子 串 
的 散 列 值 ht。 如 果 找 到 匹配 , 则 结束 搜索 ;否则 ,进入 搜索 循环 。 依 次 比较 p 与 1[i..i 十 
m 一 1] 的 散 列 值 。 在 用 深 动 散 列 技术 计算 子 串 的 散 列 值 时 ,为 了 避免 产生 负数 ,加 了 一 个 g。 

Rabin-Karp 子 串 搜索 算法 与 简单 Rabin-Karp 子 串 搜索 算法 有 以 下 两 个 主要 不 同 
之 处 : 

(1) Rabin-Karp 算法 用 滚动 散 列 技术 计算 子 串 的 散 列 值 ,每 次 需要 O(1) 时 间 , 而 简单 
Rabin-Karp 子 串 搜索 算法 每 次 需要 O(Cxz) 时 间 。 

(2) 在 Rabin-Karp 算法 中 ,找到 散 列 值 相等 的 子 串 后 ,还 需 进一步 检查 找到 的 子 串 是 
否 匹 配 。 这 是 因为 不 同 的 子 串 可 能 有 相同 的 散 列 值 , 即 发 生 冲 突 的 情况 。 

Rabin 和 Karp 已 经 证 明 , 只 要 恰当 选择 g 的 值 ,发 生 冲 突 的 概率 为 1/gq。 当 g 的 值 很 大 
时 ,发 生 冲 突 的 概率 非常 小 。 

在 找到 散 列 值 相等 的 子 串 后 ,还 要 进一步 检查 找到 的 子 串 是 否 匹 配 ,如 果 不 匹配 则 继续 
搜索 ,直到 找到 匹配 或 宣告 无 匹配 。 这 个 算法 实际 上 就 是 本 书 第 7 章 介 绍 的 Las Vegas 

事实 上 ,如果 不 对 子 串 是 否 匹 配 做 进一步 检查 , 则 算法 正确 的 概率 为 1 一 1/g。 由 此 可 
以 根据 本 书 第 7 章 介绍 的 Monte Carlo 算法 思想 ,对 于 不 同 的 9 值 来 重复 计算 ,得 到 高 概 
率 、 正 确 的 Monte Carlo 算法 。 

在 最 坏 的 情况 下 ,Rabin-Karp 算法 所 需 的 计算 时 间 为 O(nm)。 但 是 ,在 平均 情况 下 ， 
Rabin-Karp 算法 所 需 的 计算 时 间 为 O(n 十 m)。 

事实 上 ,发 生 冲 突 的 概率 为 1/g, 在 主 串 中 发 生 冲 突 的 位 置 最 多 及 n 一 m 处 。 所 以 ,在 平 
均 情况 下 ,算法 中 对 所 有 冲突 进一步 检查 是 否 匹 配 的 次 数 为 (n 一 m)/g。 

也 就 是 说 ,在 平均 情况 下 ,算法 所 需 的 计算 时 间 是 O(n) 十 OCm(n 一 m)/q)。 只 要 选择 
gm 就 有 OCm(n 一 m)/9) 二 O(n 一 m)。 由 此 可 见 ,在 平均 情况 下 ,Rabin-Karp 算法 所 需 的 
计算 时 间 为 O(n 十 mm)。 


9.1.4 多 子 串 搜索 与 AC 自动 机 


多 子 串 搜 索 就 是 要 在 主 串 中 搜索 多 个 子 串 出 现 的 位 置 。 
确切 地 说 ,如 果 待 搜索 的 多 个 字符 串 组 成 的 集合 为 P = {pi[0. .m3],pz[0.. mz],…， 


PrL0. .ml]} ,m= 22mi, 主 串 为 t[0..n 一 1], 那 么 多 子 串 搜索 问题 就 是 找 出 P 中 字符 串 在 


t 中 出 现 的 位 置 。 
如 果 对 已 中 每 个 字符 串 p; 用 一 次 KMP 算法 找 出 其 在 t 中 出 现 的 位 置 , 则 完成 多 子 串 
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搜索 任务 需要 的 计算 时 间 为 OG 十 nn 十 mz 十 nn 十 十 4 十 n) 二 O(m 十 kn)。 当 PP 中 字符 串 
个 数 较 多 时 ,这 个 算法 的 效率 就 太 低 了 。Aho-Corasick 多 子 串 搜索 算法 ,又 称 AC 自动 机 ， 
能 在 O(n 十 m 十 x) 时 间 内 完成 多 子 串 搜索 任务 ,其 中 > 是 P 中 字符 串 在 t 中 出 现 的 次 数 。 

AC 自动 机 的 基础 数据 结构 是 关键 词 树 (keyword tree)。 

定义 9.2 ”对 于 字符 串 集 合 P 的 关键 词 树 T 是 满足 如 下 3 个 条 件 的 有 向 树 : 

(1) 每 条 边 以 唯一 字符 为 该 边 的 标号 。 

(2) 从 同一 结 点 出 发 的 不 同 边 的 标号 也 不 同 。 

(3) P 中 每 个 字符 串 p; 对 应 于 本 中 一 个 结 点 w, 且 从 工 的 根 结 点 到 的 路 径 上 各 边 的 
标号 的 连接 组 成 字符 串 p;。T 醋 的 每 个 叶 结 点 都 对 应 于 PP 中 的 一 个 字符 串 。 

AC 自动 机 是 基于 P 的 关键 词 树 了 T 的 一 个 状态 自动 机 。 其 中 ,关键 词 树 T 的 每 个 结 点 
表示 一 个 状态 。 每 个 状态 都 用 一 个 非 负 整数 来 表示 ,这 个 整数 就 是 状态 结 点 的 编号 。 根 结 
点 的 编号 为 0。 

在 AC 自动 机 本 中 ,从 根 结 点 0 到 任 一 状态 结 点 s 的 路 径 上 各 边 的 标号 字符 连接 组 成 
的 字符 串 称 为 结 点 s 的 标号 , 记 为 a(s)。 

自动 机 由 3 个 函数 g,f 和 output 控制 其 运行 。 其 中 ,g 是 转向 (goto) 函 数 ,f 是 失败 
(failure) 函 数 ,output 是 输出 函数 。 

例如 , 设 P=={arrows,row,sun,under), 则 其 相应 的 自动 机 如 图 9-5 和 图 9-6 所 示 。 


-OO 


OriOrOersOrao 


图 9-5 AC 自动 机 的 转向 函数 g 


在 图 9-5 中 ,状态 号 为 0 的 结 点 是 开始 结 点 。 其 余 各 结 点 的 状态 号 分 别 为 1,2,… ,17。 

转向 函数 g(i,o) 二 Bp 表示 从 状态 i 出 发 ,相应 字符 为 o 时 ,转向 状态 B。 例 如 ,在 图 9-5 
中 g(0,r)==7, 表 示 从 开始 结 点 0 出 发 , 沿 标号 为 的 边 , 转 向 结 点 7。 

当 从 结 点 i 出 发 ,没有 标号 为 o 的 边 时 ,表示 转向 失败 (fail) ,此 时 g(i,o) 二 Bp 二 一 1。 例 
如 ,在 图 中 的 结 点 1 处 ,除了 g(1,7)==2 外 ,对 于 三 中 其 他 字符 c 天 ~ 均 有 8g(1,c) 一 一 1。 

失败 函数 实际 上 就 是 KMP 算法 中 的 前 级 函数 在 多 子 串 搜索 问题 中 的 推广 。f (2)=j 
表示 从 状态 i 出 发 ,转向 函数 转向 失败 时 则 转向 状态 结 点 7。 此 时 ,从 结 点 0 到 结 点 了 所 对 
应 的 字符 串 (7) 是 从 结 点 0 到 结 点 i 所 对 应 的 字符 串 a( 让 的 最 长 后 级。 例如 ,在 图 9-6 中 ， 
了 (5) 二 9, 表 示 从 状态 5 出 发 ,转向 函数 转向 失败 时 则 转向 状态 结 点 9。 此 时 ,从 结 点 0 到 结 
点 9 所 对 应 的 字符 串 是 row。 从 结 点 0 到 结 点 5 所 对 应 的 字符 串 是 arrow。 字 符 串 row 是 
字符 串 arrow 的 后 级 ,而且 是 所 有 从 结 点 0 开始 的 子 串 中 arrow 的 最 长 后 级。 
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. 1 2 和 4 学 6 7 8 9 | 10 11 12|113|14|151|116|17 
GO) | 0 学 8 9 | 10 10 0 0 0 |113 11410 0 0 0 7 
i 5 6 9 12 17 
output(7) row aAIrOWS TOW Sun under 


9-6 AC 自动 机 的 失败 函数 和 输出 函数 


输出 函数 output( 让 对 应 于 结 点 i 要 输出 的 集合 P 中 字符 串 ,表示 在 结 点 i 找到 的 P 中 


字符 串 


对 于 给 定 的 字符 串 集合 已 = { 户 [0. .wj ,Pi[0. .1m2j]，… ,pr[0.. mxj) ,构造 与 之 相应 的 
AC 自动 机 的 算法 分 为 两 部 分 。 在 第 一 部 分 中 确定 状态 结 点 和 转向 函数 ,在 第 二 部 分 中 计 
算 失败 函数 。 输 出 函数 的 计算 开始 于 第 一 部 分 ,并 在 第 二 部 分 中 完成 。 

AC 自动 机 的 状态 结 点 可 以 表示 如 下 : 


1 
2 
3 
4 
5 
6 
7 
8 
9 


Private class node 


{/ 


/AC 自动 机 的 状态 结 点 
int cnt; //output 

int state; 

node fail; 

node[ ] go; 
List<String> output; 


node() {go=new node[ dsize ];output=new ArrayList<String> ( ;} 


node(int size, node root) 
{ 
cnt=0; 
state= size; 
fail=root; 
go 一 new node[dsize]; 


output=new ArrayList<String>(); 
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其 中 ,state 是 结 点 编号 ,fail 是 失败 转移 结 点 ,go 是 转向 结 点 。 也 就 是 说 , 当 结 点 编号 state 
二 i 时 ,fail 就 是 结 点 FG) , 且 对 于 cEY.go[c] 存 储 转 向 结 点 g(i,o)。go 结 点 数组 的 大 小 为 
dsize 一 | 了 | ,是 一 个 与 m 和 无关 的 常数 。 

output 用 于 存储 结 点 的 输出 字符 串 集合 。 为 了 便于 说 明 算 法 思想 ,这 里 用 数组 来 存储 
结 点 的 输出 字符 串 集合 。cnt 是 output 中 字符 串 个 数 。 

在 算法 的 第 一 部 分 中 ,依次 将 pi;,1 三 ik 插入 初始 时 只 有 开始 结 点 0 的 关键 词 树 T， 
并 构建 状态 结 点 和 转向 函数 。 


1 private void insert(String word) 
2 {// 插 入 关键 词 树 

3 node cur= root; 

4 for(int i=0;i<word. length(); 十 十 D{ 

5 char wi= word. charAt(i); 

6 if(cur. goLidx[wi] ]== nullD)cur. go[idx[wi] ]=newnode(); 
7 cur 一 cur. goLidx[ wi]]; 

8 } 

9 if(cur. cnt<1)cur. output. add( word); 

10 cur. cnt=1; 


a 


其 中 , 待 处 理 的 字符 串 为 word, 它 的 第 i 个 字符 wi 用 函数 idx 映射 为 非 负 整 数 0<idx(o) 三 
pd 
例如 ,如 果 ={a,b,…,z), 则 可 以 预先 在 构造 函数 中 计算 idx 如 下 : 


1 public AhoCorasick() 

2 {// 构 造 函 数 

3 idx= new int[idsize]; 

4 for(int i=0;i<dsize; + 十 Didx['a'+i]=i; 
5 nmap 一 new node[Lnsize 十 1]; 
6 size 一 0; 

7 root 一 null; 

8 root= newnode(); 

9 


} 
函数 newnode() 用 于 建立 一 个 新 的 状态 结 点 。 


1 private node newnode() 

2 {// 建 立新 的 状态 结 点 

3 node nd 一 new node( size, root); 
4 nmap[size 十 十 ] 一 nd; 

5 return nd; 

6 


} 
其 中 ,nmap 是 状态 结 点 池 ,size 是 已 经 建立 的 结 点 数 。 
插入 算法 对 待 处 理 的 字符 串 为 word 的 每 一 个 字符 进行 处 理 。 当 直到 新 状态 就 建立 新 的 
状态 结 点 和 新 的 转向 结 点 .字符 串 word 处 理 循 环 结束 后 ,将 word 保存 到 输出 函数 集 output 
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中 。 对 于 字符 串 p;,1 三 i 过 ,插入 字符 串 算 法 insert 所 需 计算 时 间 显 然 为 Olm;) .因此 ,算法 
的 第 一 部 分 耗 时 ol( 2m)= Om), 


在 算法 的 第 二 部 分 ,根据 已 经 构建 的 转向 函数 来 计算 失败 函数 。 

按 广度 优先 的 方式 遍历 关键 词 树 TT, 依 层 序 计算 失败 函数 。 

首先 对 所 有 第 一 层 结 点 s, 计 算出 失败 函数 值 fGs) 王 0。 在 所 有 小 于 qd 层 结 点 的 失败 函 
数值 均 已 计算 出 的 前 提 下 ,计算 a 层 结 点 的 失败 函数 值 。 

具体 算法 是 对 于 d 一 1 层 的 每 一 结 点 r 和 每 一 字符 o,o€3, 目 g(r,o) 过 0。 

(1) 取 state 一 Fr) 。 

(2) 执行 state 二 FCstate) 若 干 次 ,直至 g(Cstate,a) 三 0( 由 于 g(0,o) 三 0 总 成 立 , 所 以 总 
能 找到 这 样 的 state) 。 

(3) 取 s 的 失败 函数 值 f(s) 二 g(state,o)。 

(4) 将 output( 了 (s)) 中 字符 串 加 入 output(s) 之 中 。 

考查 图 9-5 中 的 关键 词 树 TT。 计算 失败 函数 的 算法 ,首先 取 第 1 层 结 点 1,7,10 和 13， 
并 置 f(1)=f(7)=f(10)=f(13)=0。 

然后 ,依次 计算 第 2 层 结 点 2,8,11 和 14 的 失败 函数 值 。 

要 计算 F(2) , 先 取 state= 二 f(1)= 二 0。 由 于 g(0,r)==7, 可 得 f(2)=7。 

要 计算 f(8), 先 取 state 二 有 (7) 二 0。 由 于 g(0,0) 二 0, 可 得 f(8) 二 0。 

要 计算 f(11), 先 取 state 二 (10) 二 0。 由 于 g(0,u) 二 13, 可 得 F(11) 一 13。 

要 计算 f(14), 先 取 state= F(13) 王 0。 由 于 g(0.m) 王 0, 可 得 F(14) 一 0。 

依 此 方式 继续 ,最 后 可 以 计算 出 所 有 结 点 的 失败 函数 值 ,如 图 9-6 所 示 。 

在 计算 失败 函数 的 过 程 中 ,还 同时 修改 输出 函数 output。 一 旦 确定 FGs) = 一 ,就 将 Y 的 
输出 合并 到 xs 的 输出 中 。 

例如 ,在 确定 f(5) 二 9 之 后 ,就 将 结 点 9 的 输出 {row} 合 并 到 结 点 5 的 输出 中 。 由 于 结 
点 5 原来 的 输出 为 空 , 合 并 后 结 点 5 的 输出 就 改变 成 {row} 。 

计算 失败 函数 的 算法 可 具体 描述 如 下 : 


1 private void build_failure() 

2 {// 计 算 失败 函数 

3 Queue<node> q=new LinkedList<>0O; 
4 root. fail= null; 

5 q. add(root); 

6 while(! q.isEmpty()){ 

vA node cur 一 q. remove(); 

8 for(int i=0;i<dsize; 十 十 D 

9 if(cur. go[i]!=nulD{ 


10 node p= cur. fail; 

11 while(p!=null &&. p. go[i]==null) p 一 p. fail; 
12 if(p!l=nulD{ 

13 cur. go[i]. fail= p. go[i]; 

14 cur. go[i]. output. addAll(p. go[i]. output) ; 


药 cur. go[il]. cnt= cur. go[i]. output. size() ; 
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16 } 

7 q. add(cur. go[i]); 

18 } 

19 else cur. go[i]=cur==root? root:cur. fail. go[i]; 
20 } 

21 } 


算法 中 用 一 个 队列 g 来 完成 对 关键 词 树 了 的 广度 优先 遍历 。 开 始 时 g 中 只 有 一 个 根 
结 点 0。 在 算法 的 while 循环 中 ,每 次 取 队 首 结 点 cur, 执 行 前 面 所 述 步 又 (1) 一 (4)。 在 算法 
的 第 19 行 , 当 go[ 门 为 空 时 将 其 赋值 为 fail. go[ 门 ,这 样 在 后 续 搜 索 时 就 可 以 直接 转向 失败 
转向 结 点 。 在 算法 的 第 14 行 ,合并 两 结 点 p 和 g 的 output 字符 串 集合 。 

算法 build_failure 的 主要 计算 时 间 耗 费 在 算法 的 for 循环 中 。 在 for 循环 体 的 每 个 结 
点 cur 处 ,第 11 行 做 了 若干 次 失败 转向 ,然后 在 第 17 行 做 了 1 次 goto 转向 。 

如 果 结 点 cur 在 关键 词 树 工 中 的 层次 为 & , 则 第 11 行 做 的 失败 转向 次 数 不 会 超过 d。 
由 此 可 知 ,算法 的 for 循环 中 的 所 有 失败 转向 次 数 不 会 超过 已 中 全 体 字 符 串 长 度 之 和 。 算 
法 的 for 循环 中 的 所 有 goto 转向 次 数 同样 不 会 超过 P 中 全 体 字符 串 长 度 之 和 。 因 此 ,算法 
build_failure 的 for 循环 中 结 点 转向 次 数 不 超 过 2m。 除 此 之 外 ,完成 转向 后 的 计算 时 间 为 
O01) (假设 用 链表 来 存储 输出 集合 output)。 由 此 可 见 , 算 法 build_failure 所 需 的 计算 时 间 
为 OGm)。 

建立 了 字符 串 集 合 P 的 AC 自动 机 后 ,就 可 以 利用 它 有 效 地 搜索 在 给 定 主 字符 串 t 中 ， 
P 中 字符 串 出 现 的 位 置 。 

开始 时 搜索 结 点 位 于 初始 状态 0。 依 次 输入 z[0j,t[1],…,t[n 一 1], 并 按照 自动 机 转向 
函数 变换 结 点 状态 。 首 先 根 据 g(0.t[L0]) 二 zo 变换 到 结 点 z。。 在 当前 状态 结 点 state, 且 输 
和 人 字符 为 [[ 门 时 ,根据 g(state,t[ 门 )= 二 x; 的 值 将 状态 变换 到 结 点 z; ,并 输出 output(z;)。 以 
此 类 推 ,直至 处 理 完 输入 字符 串 i。 

当 给 定 主 字符 串 1 二 {bcarrowsug} 时 ,在 图 9-6 的 AC 自动 机 中 做 多 子 串 搜索 的 状态 变 
化 ,如 图 9-7 所 示 。 


9-7 多 子 串 搜索 的 状态 变化 


例如 , 当 搜 索 状 态 变 换 到 结 点 4, 且 当前 字符 为 w 时 ,由 于 g(4,w) 二 5, 自 动机 将 状态 变 
换 到 结 点 5, 前 进 到 下 一 字符 ;, 并 输出 output(5) 三 {row)}。 也 就 是 说 ,在 t[6] 处 找到 PP 中 
字符 串 row。 接 着 在 状态 结 点 5, 当 前 字符 为 *。 由 于 g(5,s) 一 6, 自动 机 将 状态 变换 到 结 点 
6 ,前 进 到 下 一 字符 wx, 并 输出 output(6) = {arrows}。 此 时 ,在 zL7] 处 找到 已 中 字符 串 
arrows。 再 接着 自动 机 将 状态 变换 到 结 点 11 ,无 输出 。 

用 AC 自动 机 做 多 子 串 搜索 的 算法 可 描述 如 下 : 


1 public int mult search(String text) 
2 {//AC 自动 机 多 子 串 搜索 

3 int cnt 一 0; 
4 


node cur= root; 


CD 
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5 for(int i=0;i<text. length() ;十 十 D) 

6 if(cur. go[Lidx[text. charAt(i) ]]!= root) { 
ra cur 一 cur. goLidx[ text. charAt(i) ]]; 

8 if(cur. cnt>0)1{ 

9 


cnt 十 一 cur. cnt; 


10 System. out. println(cur. output) ; 
11 } 

12 } 

13 return cnt; 

14 } 


算法 mult_search 的 主要 计算 时 间 耗 费 在 算法 的 for 循环 中 。 在 for 循环 体 的 每 个 结 点 
cur 处 ,第 10 行 输出 该 结 点 处 的 输出 字符 串 集合 。 如 果 P 中 字符 串 在 t 中 出 现 的 次 数 是 >， 
则 算法 输出 这 些 字符 串 总 共 耗 费 计 算 时 间 为 O(z)。for 循环 体内 其 他 计算 时 间 显 然 为 
0O(1) ,因而 总 共 耗 时 为 O(n)。 由 此 可 见 , 算 法 mult_search 需要 的 计算 时 间 为 O(n 十 x) ,其 
中 x 是 P 中 字符 串 在 t 中 出 现 的 次 数 。 

综 上 所 述 ,建立 字符 串 集 合 P 的 AC 自动 机 需要 OCm) 时 间 。 对 主 串 1 做 多 子 串 搜索 需 
要 的 计算 时 间 为 O(n 十 xz)。 因 此 ,用 AC 自动 机 完成 多 子 串 搜索 需要 的 计算 时 间 为 O(m 十” 
十 x) ,其 中 > 是 P 中 字符 串 在 t 中 出 现 的 次 数 。 

建立 字符 串 集合 尸 的 AC 自动 机 所 需 空间 是 状态 结 点 池 nmap 所 占用 的 空间 。 每 个 状 
态 结 点 需要 0(1) 空 间 。 最 坏 情况 下 的 结 点 个 数 为 m 十 1。 因 此 ,建立 字符 串 集 合 P 的 AC 
自动 机 所 需 空间 是 O(m)。 对 主 串 上 做 多 子 串 搜索 需要 的 空间 为 O(n)。 用 AC 自动 机 完成 
多 子 串 搜索 需要 的 空间 为 OCm 十 n)。 


9.2 ， 后缀 数组 与 最 长 公共 子 串 


9.2.1 后 缀 数组 的 基本 概念 


后 级 数组 是 将 一 个 字符 串 的 所 有 后 级 按照 字典 序 排序 的 字符 串 数组 。 确 切 地 说 ,后 缀 
数组 的 输入 是 一 个 文本 串 t[0..n 一 1]。 记 + 的 第 i 个 后 级 为 S$; 二 t[i..n 一 1]。 后 级 数 组 的 
输出 是 一 个 数组 saL0. .一 1], 其 中 元 素 是 0,1,…,n 一 1 的 一 个 排列 ,满足 : 

Sa < Son "< Ss 
其 中 ,一 是 按 字 典 序 比 较 字 符 串 。 由 于 zt 的 任何 两 个 不 同 的 后 级 不 会 相等 ,因此 ,上 述 排 序 
可 以 看 作 是 严格 递减 。 

例如 , 设 文本 串 是 1[0..n 一 1] 二 AACAAAAC, 则 + 的 全 部 后 级 如 图 9-8 所 示 。 

将 全 部 后 级 排序 后 得 到 后 级 数组 sa 如 图 9-9 所 示 。 

对 于 此 例 构造 出 的 后 绥 数 组 sa 二 [3.,4,5,0,6.,1,7,2]。 

对 于 任 一 有 序 集中 元 素 组 成 的 数组 s[0,n 一 1], 其 数组 元 素 s[ 门 ,0 人 i<n, 的 秩 rank[ 让 
定义 为 14s[ 门 |s[ 门 <s[ 可 ,0 入 7 过) |, 即 rank[ 引 是 数组 s[0,n 一 1] 中 比 数组 元 素 s[ 避 小 的 
元 素 个 数 。 对 于 与 后 级 数组 sa 相应 的 秩 数 组 有 rank 二 sa! , 即 若 sa[i]==j, 则 rank[j]==i。 
对 于 上 面 的 例子 有 rank 王 [3,5,7,0,1,2,4,6]。 
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第 

| 让 入 A Salo0=3 [A A A A C 9 
lA CC A A A A CG Sallj=4 |A A AC 
5|c A A AAC Sa2]=5 |A A C 章 
SI AAA AC Sa3]-0 |A A C A A A AC 
Si lA A A Sal4]=6 |A Cc 
S|A AC Sal[5=1 |A C A A A ADC 
S|A C Sal6]=7 | C 
S|c Sa7=2 |C A A A A C 

图 9-8 + 的 全 部 后 缀 图 9-9 t 上 的 后 缀 数组 

按照 后 级 数组 的 定义 ,显然 可 以 用 字符 串 排序 算法 将 1 的 n 个 后 级 排序 后 再 构造 出 后 


组 数组 sa。 由 此 可 建立 一 个 后 组 数组 类 Suffix 如 下 : 


class Suffix 
{// 后 级 数组 类 
int [ sa;// 后 缀 数组 


1 

2 

3 

4 

5 public Suffix(String str) 
6 { 

vi int n= str. length() ; 
8 sa 一 new int[n]; 

9 build(str); 


10 )} 


12 private void build(String str) 
13 ”{// 建 立 后 级 数组 


14 int n= str. length() ; 

5 String [ Jsuffixes=new String[ nj]; 

16 for(int i=0;i<n;i+t++) suffixes[i]= str. substring(i); 
17 Arrays. sort(suffixes) ; 

18 for(int i=0;i<n;it++) sa[i]=n— suffixes[i]. lengthO) ; 
19 } 

20 } 


其 中 ,由 build 用 排序 算法 对 所 有 后 组 进行 排序 ,建立 输入 字符 串 的 后 组 数组 sa。 由 于 全 部 
后 组 的 长 度 之 和 是 O(w?) ,因此 按 此 法 构造 后 绥 数 组 需要 的 计算 时 间 为 O(n?)。 


9.2.2 构造 后 缀 数组 的 倍 前 缀 算法 


本 节 要 介绍 的 构造 后 级 数组 的 售 前 级 (Prefix Doubling) 算法 是 Karp, Miller 和 
Rosenberg 提出 的 一 个 巧妙 算法 ,也 称 为 KMR 倍 前 绥 算 法 。 此 算法 效率 高 ,上 且 易 于 实现 。 
倍 前 组 算法 的 基本 思想 是 ,计算 上 的 所 有 位 置 处 长 度 为 2 的 索 次 的 前 绥 的 秩 。 长 度 为 27 的 
前 组 的 秩 可 以 依据 长 度 为 疡 的 前 绥 的 秩 , 并 利用 基数 排序 算法 来 计算 ,每 次 前 绥 长 疡 加 倍 。 
因此 ,最 多 有 logn 步 。 

首先 ,对 于 任 一 字符 串 w 定义 其 长 度 为 h 的 前 级 f;(w) 为 
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pre “ea h<=<|lwl| (9.5) 
w 其 他 

依 此 定义 ,对 于 + 的 所 有 后 缀 S;,0 志 i<n, 可 以 定义 其 hh 秩 r; (让 为 f (Si) 在 nn 个 字符 
串 fi,(So) ,fi《S1),…,f，(S,-1) 中 的 秩 。 

按照 S;( 其 中 0 三 in) 的 有 秩 定义 的 序 称 为 它 的 h 序 。 当 有 hn 时 ,hh 序 不 一 定 是 唯一 
的 。Karp,Miller 和 Rosenberg 证 明了 hh 序 具有 如 下 性 质 。 

定理 9.1 对 于 的 所 有 后 级 S;,0 志 i<<n, 如 果 以 (ri (站 ,ri(i 十 h)) 为 关键 词 排序 ,可 以 
得 到 S;( 其 中 0 二 i 二 n) 的 2h 序 。 

根据 这 个 性 质 , 倍 前 级 算法 按照 以 下 步骤 构造 + 的 后 级 数组 sa: 

(1) 取 h=0, 对 f1(So) ,有 (Si1),…,f1(S,-1) 排 序 , 并 计算 出 ri()( 其 中 0i<n)。 

(2) 取 刀 ==1, 对 序列 (x C0) 0) ,Cn ,C2)),… ,ri(n 一 1),rm(n)) 排 序 , 并 计算 
出 rs(D( 其 中 0 二 i 二 n)。 

(3) 在 一 般 情况 下 ,对 序列 (六 (0) ,rs Ch) ,CriCG1D) sr 二 he ,rs(n 一 1) ,ri(n 一 1 十 
及 )) 排 序 , 并 计算 出 ro 0D ( 其 中 0 二 i 过 n)。 

当 i 二 hn 时, 令 (i 十 让) 二 一 1。 此 时 ,5S; 的 前 有 个 字符 可 确定 其 秩 。 

(4) 当 有 hh 三 n 时 ,按照 定义 就 有 iO) 二 rank( 店 (其 中 0 过 i 过 n,) 从 而 saG) 一 rank (让 
(其 中 0i<=n)。 

例如 , 设 文本 串 是 1[0..n 一 1] 二 AACAAAAC。 用 倍 前 级 算法 构造 其 后 级 数组 的 过 程 
如 下 : 

(1) 取 h=0, 对 1(So), 有 1(S1),…, 有 i(S;)= 二 A,A,C,A,A,A,A,C 排序 ,并 计算 出 
n=(0,0,1,0,0,0,0,1)。 

(2) 取 有 =1, 对 (ri1C0) ,rm (1))， (Cr Cl) (2)), (Cr (2 一 1),r (az)) 一 (0,0), (0,1)， 
(1,0),(0,0),(0,0),(0,0),(0,1),(1, 一 1) 排 序 , 并 计算 出 r==(0,1,3,0,0,0,1,2)。 

(3) 取 有 =2, 对 (rs (0) ,rz(2)), Crs (1) re C3)) ,Cr CnO—1),r, (n+1))=(0,3),(1, 
0),《3,0),(0,0),(0,1),(0,2),(1, 一 1),(2, 一 1) 排 序 , 并 计算 出 ,==(3,5,7,0,1,2,4,6)。 

(4) 取 h==4, 对 (x4C0) ,rt(4))， (reCl) re (5)) (ra 一 1),r(z 十 3)) 一 (3,1),(5， 
2),(7,4),(0,6),(1, 一 1),(2, 一 1),(4, 一 1),(6, 一 1) 排 序 , 并 计算 出 7s=(3,5,7,0,1,2， 
4 

(5) sa 一 (re)-!: 一 (3,4,5,0,6,1,7,2)。 

构造 后 绥 数 组 的 倍 前 组 算法 可 具体 描述 如 下 : 


1 private void doubling(Cint [J]t) 

2 {// 构 造 后 级 数组 的 倍 前 缀 算法 

4 int [J]x=a; 

4 int [Jy=b; 

5 for(int i=0;i<n;it+) {x[i]=t[i];y[i]=i;} 
6 

有 

8 

9 


radix(x,y,sa,n,m); 
for(int h=1;h<n;h* 一 2){ 
sort2(x,y,h); 
int [Jtmp=x;x=y;y=tmp; //swap(x»y) 


事 与 序列 的 算法 


10 x[sa[0]]=0;m=1; 

和 for(int i 一 1;i 一 nj;i 十 十 ) x[sa[i]]=cmp(y,sa[i—1],sa[i],h,n)? m 一 1:m 十 十 ; 
12 } 

13 } 


在 算法 doubling 中 ,a 和 2 是 两 个 工作 数组 。 变 量 是 t 的 长 度 ,m 是 数组 zx 和 y 的 长 
度 中 的 最 大 值 。 

算法 的 第 5 和 第 6 行 完 成 算法 步骤 (1) 的 工作 。 其 中 ,radix 是 计数 排序 算法 。 

算法 的 第 7 一 12 行 的 循环 是 算法 的 主体 。 在 第 8 行 由 sort2 完成 步骤 (3) 的 工作 。 在 
第 9 行 交 换 数组 zx 和 > ,前 组 长 度 加 倍 。 

在 第 11 行 依据 排序 结果 计算 六 秩 。 其 中 ,用 算法 cmp 来 比较 六 前 绥 元 素 对 。 

1 private static boolean cmp(int [Jt,int u,int vvint 1，int n) 

2 1{// 比 较 h 前缀 元 素 对 

3 return t[u]==t[vj&& ut+l<n && vy+l<n && tfutl]==t[v+1]; 

4 } 


radix 是 根据 数组 y 指定 次 序 对 数组 z 做 单 轮 基数 排序 的 算法 。 


1 private void radix(int [Jx,int [Jy,int [Jz,int nyint m) 

2 {// 根 据 y 的 序 将 x 排序 为 z 

3 for(int i=0;i<m;it+) cnt[i]=0; 

4 for(int i=0;i<n;i 二 十 ) cnt[x[y[]]] 十 十 ; // 出 现 次 数 
5 for(int i=1;i<<m;i 二 十 ) cnt[ 训 十 一 cnt[Li 一 1]; 

6 for(inti=n 一 1;i>=0;i 一 一 ) z[ 一 一 cnt[x[y[D]]]=y[]， // 排 序 

了 


在 单 轮 基数 排序 算法 radix 中 ,数组 z,y,z 分 别 存 储 本 轮 待 排序 关键 词 、 上 一 轮 已 经 排 
好 序 的 关键 词 和 本 轮 排 好 序 的 关键 词 。 当 > 是 单位 排列 时 , 单 轮 基 数 排序 算法 radix 就 是 
计数 排序 算法 。 其 中 ,cnt 是 计数 器 ,对 本 轮 待 排序 关键 词 计 数 。 然 后 根据 计数 结果 ,从 小 
到 大 输出 排 好 序 的 关键 词 。 

sort2 完成 步骤 (3) 的 工作 , 即 对 2 元 序列 对 序列 (六 (0) sr G1) ,CC1) ,rm(l 十 h)),…， 
《ra《n 一 1) ,ri《n 一 1 十 h)) 排 序 。 


1 private void sort2(int []x,int [Jy,int h) 

2 {// 对 2 元 序列 对 序列 排序 

3 int t=0; 

4 for(int i=n—h;i<n;it+) y[Lt++]=i; 
5 

6 

7 


for(int i 一 0;i<n;i 十 十 ) if(sa[fi]>=h) y[t++]=sa[i]—h; 
radix(xyyysaynym); 


| 


其 中 ,第 4 和 第 5 行 根据 上 一 次 排序 结果 提取 第 2 关键 词 C1) ,ri (1 十 有 )),… ,ri (7 一 
1 十 h) 的 序 , 并 存储 于 y 中 。 在 第 6 行 用 计数 排序 算法 根据 数组 y 指定 次 序 对 数组 zx 排序 。 
算法 结束 后 ,在 数组 sa 中 返回 t 的 后 级 数组 。 

由 于 算法 radix 需要 的 计算 时 间 是 O(n) ,因此 算法 sort2 所 需 计算 时 间 也 是 O(n)。 


CD 


算法 设计 与 分 折 ( 艇 工厂) 


从 前 面 的 算法 doubling 的 主 循环 可 以 看 到 ,每 次 循环 使 h 值 加 售 , 因 此 主 循环 体 最 多 
执行 了 logn 次 。 由 此 可 见 , 在 最 坏 情 况 下 ,算法 所 需 计算 时 间 是 O(nlogn)。 
算法 所 需 的 空间 显然 是 O(n) 。 


9.2.3 构造 后 缀 数组 的 DC3 分 治 法 


构造 后 缀 数组 的 DC3 分 治 法 是 一 个 非 对 称 分 割 的 分 治 算法 。 它 的 基本 思想 是 将 1 的 所 有 
后 级 划分 为 3 组 Ro ,Ri ,R; ,首先 对 Ri ,Rs 中 的 后 级 递归 地 用 同样 的 分 治 算法 排序 ,然后 根据 
排序 结果 对 R。 中 的 后 级 排序 ,最 后 将 两 部 分 排 好 序 的 结果 合并 得 到 最 终 的 排序 结果 。 

根据 这 个 基本 思想 ,DC3 分 治 法 按照 以 下 步骤 构造 1 的 后 级 数组 sa。 

(1) 全 体 后 级 的 非 对 称 分 割 。 

对 于 k= 二 0,1,2, 定 义 

B= {i|l0<i<n—1,imod3=&} (9.6) 
并 取 C=BiUB,。 将 t 的 后 缀 按照 其 开始 位 置 分 成 两 部 分 B。 和 C。 其 中 ,B。 中 位 置 是 3 的 
倍数 ,C 中 位 置 不 是 3 的 倍数 。 

对 于 0&2,B 中 元 素 个 数 为 

a =| B; |= (n+2—k)/3 CS 

(2) 构造 C 中 3 元 组 字符 串 。 

对 &=1,2, 构 造 字 符 串 

R, 一 《ttHitkH2 ) (tarateraters) "(tmaxB, tmaxB+1 tmaxB,+2 ) (9.8) 
字符 串 R, 中 每 个 3 元 组 tit;y1ti4+s 看 作 是 一 个 字符 。 当 3 元 组 titiriti+s 长 度 不 足 3 时 ， 
即 当 i>n 一 3 时 ,不 足 部 分 用 一 个 不 在 中 的 字符 ,例如 用 $ 来 补足 , 且 其 秩 为 最 小 。 

对 字符 串 R= 二 RR 后 级 排序 得 到 的 结果 与 {S;1i€ C}) 排 序 结果 相同 。 这 是 因为 (iti 
tit2) (titstitratits)"… 与 Si 一 一 对 应 。 

要 对 尺 二 Ri1R, 的 后 级 排序 , 先 要 将 R 中 全 体 3 元 组 按 其 字典 序 排序 ,并 将 每 个 3 元 组 
titihtits 转 换 为 它 在 R 中 的 秩 。 用 rank(titiyitiss) 替 换 titiy1ti4s ,得 到 与 RR 相应 的 数字 字符 
串 R'。R' 的 后 级 数组 与 R 的 后 级 数组 完全 相同 。 

(3) 递归 后 级 排序 。 

用 DC3 算法 递归 地 对 R' 后 缀 排序 ,并 计算 出 {S;1i€E C} 中 后 级 的 秩 。 

(4) 对 Bu 中 后 绥 排 序 。 

将 Bu 中 后 级 表示 为 (t; ,rank(i 十 1))。 对 于 任 一 i€ Bo ,rank(i 十 1) 均 已 经 计算 出 。 而 
且 对 任何 i,j€ Bo, 均 有 

Si SO(ti,rank(it+1)) < ,rank(j+ 1)) (9. 9) 

对 此 序列 用 基数 排序 就 可 以 完成 对 Bu 中 后 组 的 排序 。 

(5) 合并 。 

将 已 经 排 好 序 的 C= BU B 中 后 缀 和 Bu 中 后 级 合并 ,就 可 以 得 到 所 有 后 缀 的 排序 。 

合并 时 需要 比较 S; 和 5S;, 其 中 i€C,j€ Bo。 

这 可 以 在 0(1) 时 间 完 成 ,因为 

Si SO rank(it+1)) < (8 ,rank(j 十 1)) i€B 
ls SOi,tarank(it+2)) < (tnrank(j 十 2)) i€B, 


《9. 10) 


事 与 序列 的 算法 


下 面 以 tL[0..n 一 1] 二 AACAAAAC 为 例 ,说 明 DC3 算法 构造 t 的 后 级 数组 sa 的 具体 
步 又 。 
(1) 非 对 称 分 割 。 
按照 分 割 定义 取 
Bo = {0,3,6} 
i 站 ， 
Bs = {255} 


C= Bi UB;= {1,4;7;2;5} 
(2) 构造 C 中 3 元 组 字符 串 。 
构造 字符 串 
Ri = (ACA)(AAA)(C$$) 
R, = (CAA)(AAC) 
R= RiR: = (ACA)(AAA)(C$$)(CAA)(AAC) 
用 基数 排序 算法 将 R 中 全 体 3 元 组 按 其 字典 序 排序 。 
首先 对 R 中 3 元 组 的 第 3 关键 词 A,A,$ ,A,C, 按 其 在 R 中 的 编号 1,4,7,2,5 排序 得 
到 7,1,2,4,5。 
然后 根据 第 3 关键 词 排序 结果 ,对 第 2 关键 词 CA,AA.$$ ,AA,AC 排序 得 到 7,2,4， 
Ssls 
最 后 根据 前 两 次 排序 结果 对 R 中 3 元 组 排序 得 到 4,5,1,7,2。 因 此 1,4,7,2,5 的 秩 为 
2,0,3,4,1。 
将 尺 中 每 个 3 元 组 titiiiti+s 转 换 为 它 的 秩 得 到 与 之 相应 的 数字 字符 串 R' 二 20341。 
(3) 递归 后 级 排序 。 
用 DC3 算法 递归 地 对 R' 后 级 排序 ,并 计算 出 {S;1i€EC) 中 后 缀 的 秩 。 
R' 的 后 级 数组 为 1,4,0,2,3。 相 应 的 后 级 的 秩 为 2,0,3,4,1。 
相应 的 {Si|1i€EC} 排 序 结 果 为 SS<Ss<S,<<S; 王 S: 。 
(4) 对 Bu 中 后 级 排序 。 
将 Bo 中 后 缀 表示 为 (to ,rank(1)), (zs ,rank(4)), (ts ,rank(7)) 二 (A,2),(A,0),(A,3)。 
排序 后 有 :A,0) 二 (A,2) 二 (A,3)。 因 此 ,S; 二 5。 二 S,。 
(5) 合并 。 
将 已 经 排 好 序 的 B。 和 C= BiU B, 中 后 级 
< 


局 
合并 , 则 可 以 得 到 所 有 后 缀 的 排序 。 
合并 所 用 方法 与 合并 排序 中 的 合并 步骤 所 用 方法 完全 相同 。 合 并 时 需要 比较 S; 和 Sj， 
其 中 ,i€C,j EB,。。 
按照 式 (9. 10) ,每 次 比较 可 以 在 O(1) 时 间 完 成 。 
例如 ,由 (za ,rank(5)) 二 (A,1) 之 (zs ,rank(4)) 二 (A,0), 可 知 St 二 S: 。 
依次 比较 两 个 队列 中 队 首 元 素 , 可 以 得 到 排 好 序 的 后 级 : 
有 


算法 设计 与 分 析 ( 和 区 全 版 ) 


构造 后 组 数组 的 dc3 分 治 法 可 具体 描述 如 下 : 


1 private void de3(int [Jt,int [Jsa,int nyint m) 

2 {// 构 造 后 组 数组 的 DC3 分 治 法 

3 int a0= (n+2)/3,al= (n+1)/3,al2=al+n/3; 
4 int [Jt12=new intLal2 十 3]; 

5 int [Jsal2=new intLal2 十 3]， 

6 t[n]=t[n+1]=0; 

int p= divide(t,sa,tl2,n,m,al ,al2); 

8 conquer(t,sal2,tl2,n,m,p,al ,al2); 

9 merge(t,sa,sal2,n,m,a0,al,al2); 

10 } 


在 算法 dc3 中 ,数组 t 存储 待 排序 字符 串 ,sa 是 后 级 数组 。 变 量 n 是 输入 字符 串 长 度 ， 
m 是 单个 字符 最 大 值 。 数 组 i12 用 于 保存 要 递归 处 理 的 新 字符 串 R',sal2 是 相应 的 后 级 数 
组 。 变 量 a0,al,al2 分 别 表示 a0,al,al 十 a2。 为 了 表示 字符 $ , 置 t[nj] 和 +t[n 十 1] 为 0。 

算法 采用 分 治 策略 ,其 3 个 主要 步骤 如 下 : 

(1) 非 对 称 分 割 (divide) 。 

(2) 递归 后 组 排序 (conquer) 。 

(3) 合并 (merge) 。 


1 private int divide(int [ Jt,int [Jsa,int []tl2,int n,int m,int al ,int al2) 
2 {// 非 对 称 分 割 

3 int d=0; 

4 for(int i=0;i<n;i 二 + 十) if(i%3!1=0) a[d 十 十 ]=i; 

5 radix(t,a,b,al2,m,2); 

6 radix(t,b,a,al2,m,1); 

有 radix(t,a,b,al2,m,0); 

8 d=1;tl2[add1(b[0],al)]=0; 

9 for(int i 王 15i<<al2;i 十 十 ) 


10 tl2[add1(b[i],al)]=cmp(t,b[i—1],b[i])? d 一 1:d 十 十 ; 
11 return d; 
12 } 


在 非 对 称 分 割 算法 divide 中 ,第 4 行 构 造 C=BiUB;。 第 5~7 行 对 R 中 3 元 组 做 基数 
排序 。 第 8 一 10 行将 R 转换 成 相应 的 数字 字符 串 R'。 返 回 的 数字 d 是 R 中 3 元 组 的 最 大 
秩 。 在 转换 时 当 两 个 3 元 组 的 3 个 字符 都 相等 时 ,这 两 个 3 元 组 的 秩 相 同 。 下 面 的 比较 函 
数 cmp 用 于 此 目的 。 


1 private static boolean cmp(int [Jt,int u,int v) 

2 {// 比 较 函 数 

1 return t[u]==t[v] && tfut+1]==t[v+1] && tfut+2]==t[v+2]; 
4 } 


转换 后 的 数字 字符 串 R' 存 储 于 数组 112 中 。R 中 3 元 组 titintiyz 对 应 于 {S;|i€C}= 
Bi UB, 。 对 任 一 ziEB, 有 ;一 3 十 1.0 委 入 cl 一 1。 


事 与 序列 的 算法 


对 于 任 一 i€ Bs, 有 i 二 3k 十 2,0 二 ka2 一 1。 因 此 ,在 数组 112 中 将 3 元 组 {titititits| 
iE Bi}) 的 秩 存储 于 112[i/3] 中 ,3 元 组 {iitinititz1i€ Bs}) 的 秩 存储 于 1z12[al 十 i/3] 中 。 地 址 
函数 addl 用 于 计算 3 元 组 titii1ti;s 在 数组 t12 中 的 存储 位 置 。 


1 private static int add1(int pyint al) 

2 {// 地 址 函数 

3 return (p)/3+((p)%3==17? 0:al); 
4 } 


非 对 称 分 割 算法 对 3 元 组 做 基数 排序 时 ,分 别 对 每 个 关键 词 用 单 轮 基数 排序 算法 radix 
进行 排序 。 算 法 conquer 对 分 割 后 的 字符 串 递 归 地 进行 后 组 排序 。 


1 private void conquer(int [Jt,int []sal2,int [Jt12,int nyint m,int p,int al,int al2) 
2 {// 递 归 后 缀 排序 

3 int i,a0=0; 

4 if(p<al2) dc3(t12,sal2,al2,p); 

5 else for(i=0;i<al2;i+++) sal2[t12[i]]=i; 

6 for(i=0;i<al2;i 二 + 十) if(sal2[i]<al) b[a0+ 二 +]=sal2[i] * 3; 

7 if(n%3==1) b[a0++]=n—1; 
8 radix(t,b,a,a0,m,0); 
9 


了 


在 算法 conquer 的 第 4 行 , 当 p 二 al2 时 ,字符 串 R' 中 还 有 相同 的 秩 , 此 时 用 算法 dc3 对 
字符 串 R' 递 归 计 算 其 后 级 数组 。 当 p= 二 a12 时 ,表明 字符 串 R 中 没有 相同 的 秩 , 此 时 可 以 
直接 输出 其 后 级 数组 。 算 法 接着 在 第 6 一 8 行 对 B。 中 2 元 组 (t;,rank(i 十 1)),iE€ Bo 做 后 
缀 排序 。2 元 组 的 第 2 关键 词 已 经 排 好 序 , 由 数组 sal2 给 出 。 在 第 7 行 中 , 设 k=sal2[ 站 ， 
则 相应 的 ;一 3AE Bu。 在 第 8 行 对 第 1 关键 词 喜 排序。 在 S;,i€ B。 和 S;,iE€ BiU Bs 排 好 
序 后 ,算法 merge 将 它们 合并 成 所 有 后 组 的 排序 。 


1 private void merge(int []t,int [Jsa,int []sal2,int nyint m,int a0 ,int al ,int al2) 
2 {// 后 缀 合并 

a int i,j,p; 

4 for(i=0;i<al2;i 二 十) b[i]=add2(sal2[i] ,al); 

5 for(i 一 0;i 一 al2;i 十 十 ) cLb[i]]=i; 

6 for(i=0,j=0,p=0;i<a0 && j<al2;p 十 十 ) 

7 sa[p]=cmp2(b[j] %3,t,a[i],b[j])? a[i 十 十 ]:bUj 十 十 ]; 

8 for(;i<a0;p 十 十 ) sa[p] 一 a[Li 十 十 ]; 

9 for(;j<al2;p 十 十 ) saLp]=bLj 十 十 ]; 

10 } 


在 算法 merge 的 第 4 行 ,add2 根据 后 级 数组 sal2 中 的 秩 返回 它 在 原 字 符 串 中 地 址 。 
例如 , 当 sal2[ 疏 =k, 则 根据 地 址 addl 存放 规则 ,有 
i=3k+1€EB k<al 
ee kal 
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1 private static int add2(int p,int al) 

2 {// 秩 在 原 字 符 串 中 地 址 

3 return (p)<al? (p) * 3 十 1:((p) 一 al)x* 3+2; 
， 


算法 merge 的 第 5 行 在 数组 c 中 保存 后 级 数组 sa[ 门 (其 中 i€ Bi UB,) 的 值 。 
然后 在 第 6 一 7 行 ,cmp2 按照 式 (9.10) 比 较 两 个 队列 中 队 首 元 素 ,合并 排序 。 
1 private boolean cmp2(int k,int [Jt,int u,int v) 

2 {// 比 较 两 个 队列 中 队 首 元 素 

L if(k==2) return t[uj<t[v]j||t[u]==t[v] && cmp2(1,t,ut1,v+1); 

4 else return t[u]<t[vj||t[u]==t[v] && cfut1]<c[Lv+1]; 

5 } 


如 果 在 最 坏 情况 下 算法 dc3 所 需 计 算 时 间 是 fm) , 则 容易 看 出 f(n) 二 O(n)。 
事实 上 ,算法 dc3 中 除了 算法 conquer 需要 的 计算 时 间 外 ,算法 divide 和 算法 merge 需 
要 的 计算 时 间 均 为 O(n)。 
字符 串 R 的 长 度 为 2n/3, 因 此 算法 conquer 需要 的 计算 时 间 为 f(2n/3) 十 O(n)。 
由 此 可 知 ,f(n) 满 足 如 下 递归 方程 
O00) n3 
fl(n)= 
a n>>3 
递归 方程 的 解 是 f(n) 二 O(n)。 
9.2.4 最 长 公共 前 组 数组 与 最 长 公共 扩展 算法 


1. 最 长 公共 前 级 数 组 

与 后 级 数组 关系 十 分 密切 的 最 长 公共 前 级 数组 (longest common prefix,lcp) 定 义 如 下 : 

对 于 给 定 的 字符 串 t[0..n 一 1] 及 其 后 级 数组 saL0..n 一 1],t 的 最 长 公共 前 级 数组 lcp 
[1. .7 一 1] 的 值 1cp[ 疏 ,0 志 in 一 2, 定 义 为 1 的 后 级 Ssrj 和 Switn 的 最 长 公共 前 级 的 长 度 。 

例如 , 当 it[0..n 一 1] 二 AACAAAAC, 且 sa=[3,4,5,0,6,1,7,2] 时 ,sa[L0] 王 3,sa[1] 一 
4,S; 二 AAAAC,S, 二 AAAC,S; 和 Ss 的 最 长 公共 前 级 的 长 度 为 3, 因 此 ,lcp[0]=3。 

如 果 依 次 计算 lcp[ 疏 ,0 志 i<n 一 2, 最 坏 情况 下 需要 Ox ) 计 算 时 间 。 如 果 改 变 计 算 次 
序 ,按照 sa ![ 让 ,0 二 i<n 一 1 的 次 序 来 计算 [=lcp[sa7 [让 ],0 志 in 一 2, 就 可 以 大 大 节 
省 需要 的 计算 时 间 。 

对 于 上 面 的 例子 ,容易 看 到 sa! = 二 [3,5,7,0,1,2,4,6]。 按 照 此 次 序 来 计算 得 到 h[ 站 = 
lepLsa [ij]]=[1,0,0,3,2,3,2,1]。 

由 此 注意 到 ,h[ 嫩 具有 如 下 重要 性 质 : 

h[i+1] 宇 h[i] 一 1 (9.11) 

换 句 话说 ,如 果 已 知 有 [局 =&, 则 接着 计算 h[i 二 1] 时 ,就 已 知 相 应 的 最 长 公共 前 级 的 长 

度 至 少 是 一 1。 因 此 ,无 须 比 较 前 一 1 个 字符 ,因而 大 大 节省 了 比较 字符 的 时 间 。 


1 private void kasai(int [jt,int n) 
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2 {// 构 造 最 长 公共 前 缀 数组 lcp 
3 int k=0; saLn]=n; 

4 for(int i=0;i<n;it+) rank[Lsa[i]]=i; 章 
5 for(int i=0;i<n;it+ ){ 

6 int j= saLrank[i] 二 1]; 
人 
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CD 


while(i 十 k<n && j 十 k<n && tfit+kj==t[j 十 kj) k++; 
lepLrank[i]]=k; 
if(k>0)k——; 


在 算法 kasai 中 用 数组 rank 存储 sa“'。 在 算法 第 7 行 跳 过 了 已 知 相等 字符 的 比较 。 算 
法 kasai 第 9 行 置 k=h[i] 一 1。 
考查 算法 中 上 值 的 变化 .开始 时 = 二 0, 在 算法 的 第 7 行 k 值 增加 ,第 8 行 k 值 减 1,. 在 第 


i 次 循环 k 值 最 多 增加 [站 一 h[i 一 1] 十 1。 因 此 ,算法 的 第 7 行 值 增加 量 不 超过 CI ] 


h[i 一 1 十 1) ==h[n 一 1] 一 h[0] 十 n 一 1 过 2n. 第 8 行 k 最 多 值 减少 nn 一 1 次 。 由 此 可 见 

算法 的 主 循环 需要 的 计算 时 间 为 0(n) 。 算 法 的 其 他 计算 时 间 显然 为 O(n)。 

2. 最 长 公共 扩展 问题 

对 于 一 个 给 定 字 符 串 [0. .2 一 1 ,最 长 公共 扩展 问题 是 对 于 非 负 整 数 0/7, 计算 z 
的 后 级 S, 和 S, 的 最 长 前 级 的 长 度 lceCL,r)。 

例如 ,t[0..n 一 1]= 二 AACAAAAC,l=1,r=6 时 ,Si 二 ACAAAAC,Ss 二 AC。S!1 和 Ss 
的 最 长 前 缀 是 AC。 因 此 ,lce(1.6) 一 2。 

借助 于 输入 字符 串 1 的 后 级 数组 sa, 以 及 最 长 公共 前 缀 数组 lcp, 可 以 设计 出 计算 zt 的 
最 长 公共 扩展 lce(1,7) 的 高 效 算法 。 

对 于 非 负 整数 0/r, 设 z==sa [1j,z==sa ![rj, 则 sa[xj]==1,sa[zj= 二 r。 不 失 一 般 
性 可 设 zx 过 =。lce(L,r) 具 有 如 下 性 质 : 

lce(l,7r) = min {lee(sa[yj,sa[y+ = min {lepLy]} (9.12) 

由 此 可 知 ,最 长 公共 扩展 问题 转换 为 对 于 最 长 公共 前 缀 数组 lcp 的 区 间 最 小 查询 问题 
(range minimum query, RMQ)。 借 助 于 最 长 公共 前 缀 数组 lcp 及 其 区 间 最 小 查询 问题 算法 
RMQ, 设 计 最 长 公共 扩展 算法 如 下 : 


1 public int lce(Cint l,int r,int n) 

2 {// 最 长 公共 扩展 

3 if(l==7) returnCn 一 D; 

4 return rmq( Math. min(rank[1] ,rank[r]), Math. max(rank[1],rank[r])); 
5 } 


其 中 ,rmq(low ,high) 用 于 查询 最 长 公共 前 级 数组 lcp 在 区 间 [low ,high) 中 的 最 小 值 。 


1 private int rmq(int low,int high) 

2 {// 区 间 最 小 查询 

» int v=1cp[low]; 

4 for(int i 一 low 十 1;i 二 high;i 十 十 ) if(lcp[i]<v) v=1cp[i]; 
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5 return v; 
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简单 rmq 算法 需要 OChigh-low) 时 间 。 因 而 ,最 长 公共 扩展 查询 在 最 坏 情况 下 需要 O(n) 
时 间 。 如 果 对 最 长 公共 前 绥 数 组 lcp 做 适当 预 处 理 ,rmq 算法 的 响应 时 间 可 以 降低 到 O(1)。 


9.2.5 最 长 公共 子囊 算法 


对 于 给 定 的 两 个 长 度 分 别 为 m 入 的 字符 串 s; 和 s; ,最 长 公共 子 串 问 题 就 是 要 找 出 5 
和 s 的 长 度 最 长 的 公共 子 串 。 注 意 到 字符 串 % 的 任 一 子 串 都 是 它 的 某 个 后 级 的 前 级 。 因 
此 ,要 找 出 ss 和 sa 的 长 度 最 长 的 公共 子 串 ,等 价 于 计算 s, 的 后 级 和 ss 的 后 级 的 公共 前 级 的 
最 大 值 。 通 过 比较 s, 和 ss 的 所 有 后 缀 就 可 以 找 出 它们 的 最 长 的 公共 子 串 。 但 这 样 做 的 效 
率 不 够 高 。 利 用 后 级 数组 这 一 有 效 工具 ,可 以 设计 出 高 效 算法 。 

算法 的 基本 思想 是 用 一 个 新 的 字符 串 ;二 5 $ss 来 表示 两 个 输入 字符 串 。 其 中 , $ 是 不 
在 s 和 ss 中 出 现 的 字符 。 

计算 * 的 后 级 数组 sa 和 最 长 公共 前 缀 数组 lcp。 注 意 到 ,最 长 公共 前 级 数组 lcp 中 的 最 
大 值 就 是 * 的 所 有 后 级 中 的 公共 前 级 的 最 大 值 。 当 然 ,这 两 个 后 级 有 可 能 同属 于 s 或 s,。 
排除 两 个 后 级 同属 于 * 或 s; 的 情形 ,就 找到 了 中 分 别 属于 s: 和 s; 后 级 中 的 公共 前 缀 的 
最 大 值 。 这 就 是 要 找 的 % 和 ss 最 长 的 公共 子 串 的 长 度 。 按 照 这 个 思路 ,可 以 设计 出 最 长 公 
共 子 串 算法 如 下 : 


1 public int longest(String sl,String s2) 
2 {《// 最 长 公共 子 串 算法 

3 int ans 一 0; 

4 int m=sl. length(); 

5 int n= sl. length() 十 s2. length(); 

6 String t 一 change(s1,s2); 

7 int [Jsa=new int[t. length()]; 

8 int [Jlep=new int[t. length()]; 

9 SuffixDC3 suf=new SuffixDC3(t); 
10 sa 一 suf. sa;lcp= suf. lep; 

11 for(int i 一 0;i<n 一 13i 十 十 ) 

12 if(lcp[i]>ans && diff(sa,m,i)) ans=1cp[i]; 
13 return ans; 

14 } 


在 算法 longest 的 第 6 行 的 change 将 两 个 输入 字符 串 s; 和 sy 变换 成 一 个 新 的 字符 串 


t=s10s20。 


1 private static String change(String sl ,String s2) 
2 《// 字 符 串 变换 

int m 一 sl. length(), n= s2. length(); 

4 String t=sl 十 "0" 十 s2 十 "0"; 

5 Teturn t; 
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} 


事 与 序列 的 算法 


在 算法 longest 的 第 7 一 10 行 计算 字符 串 t 的 后 级 数组 sa 和 最 长 公共 前 绥 数 组 lcp。 
接着 在 算法 的 第 11 一 12 行 计 算 所 有 后 绥 中 的 公共 前 组 的 最 大 值 。 其 中 ,用 到 diff 来 判断 相 
邻 的 两 个 后 绥 是 否 属于 同一 输入 字符 串 。 

1 private static boolean diff(int [Jsa,int m,int i) 

2 {// 相 邻 两 个 后 缀 判断 

3 return (m<sa[i] && m>sa[it+1])||(m>sa[i] &8 m<sa[it+1]); 

4 上 


上 述 算法 的 主要 计算 量 在 于 构造 字符 串 t 的 后 缀 数组 sa 和 最 长 公共 前 缀 数组 lcp。 这 
需要 Olm 十 n) 计 算 时 间 。 由 此 可 见 , 用 字符 串 的 后 级 数组 这 一 工具 ,可 以 在 OCm 十 nn) 时 间 
找 出 s 和 s; 的 最 长 的 公共 子 串 。 


9.3 序列 比较 算法 


本 节 所 用 的 术语 序列 ,实际 上 就 是 串 。 它 们 的 主要 不 同 在 于 子 串 和 子 序列 的 定义 。 
对 于 两 个 串 x 和 y ,如 果 存 在 |z| 十 1 个 串 wo ,two ，… ,wiz ,使 得 
y = wox[LOJwz[1]z[L| zx |— 1Jwia 
则 称 z 是 y 的 一 个 子 序 列 。 也 就 是 说 ,z 是 从 串 y 中 删 去 |y| 一 |z| 个 字符 得 到 的 串 。 当 
2 天 y 时 , 则 称 工 是 y 的 一 个 真子 序列 。 特 别 地 ,在 子 序列 的 定义 中 , 当 w= 二 … 二 ws-1 二 e 
时 ,x 就 是 y 的 一 个 子 串 。 


9.3.1 编辑 距离 算法 


两 个 给 定 序列 xz[0..n 一 1] 和 y[0..m 一 1 之 间 的 编辑 距离 ,是 指 将 一 个 序列 转换 成 另 
一 个 序列 所 需 的 最 少 编辑 操作 次 数 。 编 辑 操作 包括 将 序列 中 一 个 字符 替换 成 另 一 个 字符 、 
插入 一 个 字符 以 及 删除 一 个 字符 。 一 般 来 说 ,两 个 字符 串 之 间 的 编辑 距离 越 小 ,它们 的 相似 
度 就 越 大 。 

用 记号 (uw) 表示 将 序列 中 一 个 字符 u 替换 成 男 一 个 字符 v;(u->e) 表 示 将 序列 中 一 
个 字符 删除; (ez 表示 在 序列 中 插入 一 个 字符 w。 这 些 编辑 操作 的 开销 可 以 用 y 来 度 
量 。 函 数 7 通常 满足 如 下 三 角 不 等 式 

Xu 一) 十 YX 一世) Yu w) 
最 常用 的 是 Levenshtein 度量 : 


0 2 一 也 
Yl(u > v) = (uv) 一 (9. 13) 
1 Uv 


对 于 任何 Gi, 站 ,0 二 i<n 一 1,0 志 jj 过 m 一 1, 将 x[0. . 门 与 y[0.. 门 之 间 的 编辑 距离 记 为 
d(i, 门 ,; 则 qd(i, 巾 满足 如 下 动态 规划 递归 式 


0 i 一 了 一 一 1 
adG 一 1, 一 D) 十 1 1 全 0 人 7 一 一 1 
TM? 19 

di— lL 
hs | 其 他 
d(i—1,7—1)+6z[i],yLi]) 


站 法 讼 计 与 分 原 (第 荆 版 ) 


其 中 ,当主 一 1 时 ,zx[0. .站 为 空 串 ;j 二 一 1 时 ,y[0. .站 为 空 串 。 

当 z[0. . 门 为 空 串 时 ,将 z[0.. 革 变换 为 y[0.. 门 的 唯一 方式 是 插入 相应 字符 ,而 当 
y[L0.. 门 为 空 串 时 ,将 z[0. .局 变 换 为 >[0. . 门 的 唯一 方式 是 删除 相应 字符 。 因 此 , 式 (9. 14) 
在 ;一 一 1 和) 一 一 1 时 显然 是 正确 的 。 当 i,j 宇 0 时 ,首先 注意 到 ， 

ddG 一 1, 力 十 1 
d(i,) 三 mintdG 一 1) 十 1 (9.15) 
d(i—1,j—1)+6(z[i],y0)]) 

考查 z[0. .可 是 如 何 变换 为 y[0. . 门 的 。 

(1) 当 zz[ 杂 =y[j] 时 ,zx[0..i 一 1] 已 经 用 4d(i 一 1,j 一 1) 个 操作 变换 为 y[0..j 一 1]。 因 
此 ,z[0. . 订 可 以 用 dG 一 1 一 1) 十 SCz[ 详 ,y[ 门 ) 个 操作 变换 为 >[0. . 门 。 

(2) 当 zx[ 门 关 y[j] 时 ,考查 最 小 编辑 距离 的 最 后 一 次 的 操作 。 

Q 如 果 最 后 一 次 的 操作 是 插入 操作 (e 一 y[j]) , 即 插入 >[7 门 , 则 可 以 确定 xz[0. .站 已 经 
用 d(i,j 一 了 个 操作 变换 为 y[0..j 一 1]。 由 此 可 知 ,在 这 种 情况 下 用 了 d(i,j 一 1) 十 1 个 
操作 。 

@ 如 果 最 后 一 次 的 操作 是 删除 操作 Cz[ 详 ->s), 即 删除 z[ 襄 , 则 可 以 确定 z[0. .i 一 1 已 
经 用 d(i 一 1, 站 个 操作 变换 为 y[0.. 门 。 由 此 可 知 , 在 这 种 情况 下 用 了 d(i 一 1,7) 十 1 个 
操作 。 

@ 如 果 最 后 一 次 的 操作 是 替换 操作 (zx[ 疏 >y[j]) ,即将 z[ 记 替换 为 y[ 站 , 则 可 以 确定 
Zz[0..i 一 1] 已 经 用 d(i 一 1,j 一 了) 个 操作 变换 为 y[0..j 一 1]。 由 此 可 知 , 在 这 种 情况 下 用 了 
di 一 1 一 1) 十 SCz[ 菩 ,y[ 门 ) 个 操作 。 

综合 以 上 情形 即 知 式 (9. 15) 成 立 。 

另 一 方面 ,总 可 以 用 d(i,j 一 1) 个 操作 将 z[0.. 实 变 换 为 y[L0..j 一 1], 然 后 用 插入 操作 
(ey[j]) 插 入 y[j] 后 将 z[0. .可 变换 为 y[0. . 门 。 因 此 ,有 

d(i,j)) <d(i,j—l)+1 (9. 16) 

类 似 地 ,总 可 以 用 d(i 一 1, 由 个 操作 将 z[0. .i 一 1] 变 换 为 >[0.. 门 ,然后 用 删除 操作 

(ze) 删 除 x[ 杂 后 将 z[0. .让 变换 为 y[L0.. 门 。 因 此 ,有 
d(isj)) <d(i—1,))+1 (9.17) 

同 理 , 可 用 dG 一 1 一 1) 个 操作 将 xz[L0.. i 一 1] 变 换 为 yL0..j 一 1], 然 后 用 替换 操作 

(z[ 让 一 y[ 门 ) 将 x[ 门 替换 为 y[ 门 后 将 z[0. .可 变换 为 >[0. . 门 。 因 此 ,有 


di di—1j— +aztilyyt (9. 18) 
综合 式 (9.16) \ 式 (9.17) 和 式 (9.18) .可知 
d(i—1,7)+1 
d(i,) Smindd(i,j—1)+1 (9. 19) 


d(i—1,j—1)+6(zx[i],y[Li]) 
结合 式 (9.15) 和 式 (9. 19) 即 知 式 (9. 14) 正 确 。 
据 此 可 以 设计 计算 给 定 序列 xz[0..n 一 1] 和 y[L0..m 一 1] 之 间 的 编辑 距离 的 动态 规划 算 
法 ,如 下 所 示 : 


1 public int ed() 
2 {// 编 辑 距离 的 动态 规划 算法 
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3 for(int i 一 0;i 一 一 nj;i 十 十 ) d[iJ[0]=i; 第 
4 for(int i 一 0;i< 一 mi;i 十 十 ) d[0J[i]=i; 9 
5 forlinti=0;i<n;i++) 章 
6 for(int j=0;j<=m;j 二 十 ) 

wl if (x. charAt(i) ==y. charAtGj)) d[i+1]J0+1]=d[i]0]; 

8 else d[i+1J[j+1]= Math. min(d[ 订 Dj] 十 dt,Math. min(Cd[ 订 [j 十 1],d[i+1]0]) 十 1)， 

9 return dLn][m]， 

10 } 


在 上 面 的 算法 描述 中 ,为 了 便于 表示 i 和 j 均 为 一 1 的 情形 ,用 数组 单元 d[i 十 1][j 十 1] 
来 存储 式 (9. 14) 中 的 4(i,j)。 从 算法 的 双重 for 循环 容易 看 出 ,算法 需要 的 计算 时 间 和 空 
间 均 为 O(nm)。 根 据 数组 d 存储 的 信息 ,采用 下 面 的 算法 back, 可 以 用 OCmax{n,m)) 时 间 
构造 出 最 优 编辑 操作 序列 。 

1 public void back(int i,int j) 

2 {// 构 造 最 优 编辑 序列 

3 if(i==0 || j==0) return; 

4 if(x. charAt(i—1) y. charAt(j—1)) back(i—1,j—1); 
5 elseifCd[i—1J0—1]+dt<Math. min(d[i 一 1]0],d[i[ 一 ?十 1){ 
6 
L# 
8 
9 


back(i 一 1,j 一 1); 
System. out. println("r("” 十 〈i 一 1) 十 "," 十 一 1) 二 + ")"); 
} 
else if(d[Li 一 1][]<dLi]D 一 1){ 
10 back(i 一 1,j); 


11 System. out. println("d(" + (i—1) + ")"); 
12 } 

13 else{ 

14 back(i,j—1); 

15 System. out. println("i(" 十 (j 一 1) + ")"); 
16 } 

17 } 


算法 输出 最 优 编辑 序列 时 ,用 (i,j) 表 示 替 换 操作 (z[ 疏 >y[j]) ;用 d( 让 表示 删除 操作 
(z[ 引 >e); 用 i()) 表 示 插 入 操作 (e 一 y[ 站 ])。 注 意 到 在 用 动态 规划 算法 计算 编辑 距离 时 , 算 
法 edn 在 第 5 行 的 for 循环 中 对 每 个 确定 的 i 值 ,循环 体内 只 用 到 数组 a 的 第 i 和 i 十 1 行 的 
值 。 利 用 这 一 点 可 以 将 算法 所 需 的 空间 进一步 减少 到 O(min{n,m))。 


1 public int edn() 

2 《{//OCn) 空 间 算法 

3 int oldd=0,newd; 

4 for(int i=0;i<=n;it 二 ) 

5 for(int j 王 05j< 一 m;j 十 十 ) 

6 if(i==0){oldd=d1[0j];d1[0j]=j;} 

7 else if(j==0){o0ldd=d1[j];d1[j]=i;} 

8 elsef 

9 if(x. charAt(i—1)==y. charAt(j—1)) newd= oldd; 
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10 else newd 一 Math. min(oldd 十 dt,Math. min(dl[0j 一 1],dl1D]) 十 1); 
kh oldd=d1[j];d1l[j]=newd; 

12 } 

13 return dl[m]; 

14 } 


算法 edn 中 用 一 个 一 维 数组 d1 来 存储 原 数 组 d 的 第 i 和 i 十 1 行 的 值 。 在 第 5 一 6 行 
的 for 循环 中 对 每 个 确定 的 了 和 的 值 ,d1[0..j 一 1 存储 d[i 一 1j[L0..j 一 1j] 的 值 ,而 dl 
[j..m 存 储 di. .mj 的 值 。oldd,newd 用 于 存储 新 老 交替 时 dz][ 门 的 值 。 


9.3.2 最 长 公共 单调 子 序 列 


最 长 公共 单调 子 序列 问题 源 于 两 个 经 典 的 序列 比较 问题 , 即 最 长 公共 子 序 列 (LCS) 问 
题 和 最 长 递增 子 序 列 (LIS) 问 题 。 

对 于 给 定 的 两 个 序列 xz[0..n 一 1] 和 y[L0..m 一 1], 最 长 公共 单调 子 序列 问题 就 是 要 找 
到 x 和 yy 的 公共 子 序列 = ,使 得 x 是 一 个 单调 子 序列 且 长 度 最 长 。 这 里 所 说 的 单调 ,是 指 序 
列 单调 递增 或 单调 递减 。 为 了 明确 起 见 ,后 续 讨 论 均 指 序列 严格 递增 。 其 他 情形 的 讨论 是 
类 似 的 。 

例如 , 设 z=(3,5,1,2,7,5,7) 和 y=(3,5,2,1,5,7), 则 n=7 且 m=6。z=(3,1,2,5) 
是 工 的 一 个 子 序列 , 它 在 xz 中 相应 的 下 标 序 列 是 (1,3,4,6)。 序 列 (3,5,1) 和 (3,5,7) 都 是 xz 
和 y 的 公共 子 序列 , 且 (3,5,7) 是 z 和 vy 的 最 长 递增 子 序 列 。 

对 任何 (i, 站 ,0i<n,0j 达 ms,x[0.. 疏 与 yL0.. 门 的 以 y[j] 结 尾 的 最 长 公共 递增 子 
序列 组 成 的 集合 记 为 LCIS(i,j)。 集 合 LCIS(i, 店 中 的 最 长 公共 递增 子 序列 的 长 度 记 为 
f(i,j)。 

当 xz[ 让 =y[ 站 j,0 志 i 过 n,0 志 j 过 m 时, 称 xz 和 y 在 (i,7) 处 匹配 。 

对 任何 (i, 站 ,0 二 i 过 n,0 壹 j 二 m, 如 果 xz 和 y 在 (i, 丫 处 匹配 , 则 其 特殊 的 下 标 集 BGi 7 
定义 为 

BiD))D={t | 1<t<j,y < zi) (9. 20) 

与 最 长 公共 子 序列 问题 类 似 ,可 以 用 动态 规划 算法 求解 最 长 公共 递增 子 序列 问题 。 

定理 9.2 设 z[L0..n 一 1] 和 y[L0..m 一 1j 是 两 个 给 定 的 长 度 分 别 为 n 和 wm 的 序列 。 对 
任何 Gi, ,0 二 i 过 n,0 志 j 过 mm,x[0.. 门 与 y[0.. 门 的 以 y[ 门 结尾 的 最 长 公共 递增 子 序列 的 
长 度 FG 7 满足 如 下 动态 规划 递归 式 

0 i<0oOVj<0 
fi)) 一 17G 一 1.7) ij 宇 0 A z[i] A y[Li] (9.21) 
人 ij 之 0 人 一 太 


证 明 : (1) z[ 详 和 y[ 门 的 情形 。 

此 时 有 xzELCIS(i,j) 当 且 仅 当 x€ELCIS(i 一 1,7), 即 LCIS(i,j)= 二 LCIS(i 一 1,7)。 因 
此 ,fCi, 站 = 了 (i 一 1,j)。 

(2) z[ij 王 yLjj 的 情形 。 

设 xz[0..&]ELCIS(i, 站 是 xz[0.. 引 与 yL0. .jj 的 以 yLjj 结 尾 的 最 长 公共 递增 子 序列 。 
此 时 有 f(i, 站 = 十 1 且 z[0..& 一 1 是 x[0..i 一 1] 与 y[0. .可 的 公共 递增 子 序列 ,其 中 ,0 过 


事 与 序列 的 算法 


1<j 且 z[% 一 1 二 y[tj 过 y[jj]。 因 此 ,k 一 1 志 f(i 一 1,z)。 由 此 可 知 
f0i,)) 1+ ,maxfli 1 (9. 22) 
另 一 方面 ,对 于 0<1<j, 设 z[0..k]ELCIS(Gi 一 1,) 且 z[k] 二 y[1] 过 y[j], 则 zy[j] 是 
Zz[0. .站 与 yL0. .让 的 一 个 以 y[ 站 结尾 的 公共 递增 子 序列 。 
因此 ,十 2 三 f(i,j)。 也 就 是 说 ,了 (i 一 1,7) 十 1 过 f(i,j)。 由 此 可 知 
fi,)) 1+ maxfli 1 (9. 23) 
结合 式 (9. 22) 与 式 (9. 23) 即 知 fiD=1+ ma97G 一 10)。 
最 后 ,要 求 的 z[0..2 一 1] 和 y[0..m 一 1] 的 最 长 公共 递增 子 序 列 的 长 度 就 是 max 
{f(n—1,7)}。 
根据 式 (9. 21) ,可 以 设计 求解 最 长 公共 递增 子 序列 问题 的 动态 规划 算法 如 下 : 


1 public int lcisCint n,int m,int [Jx,int [Jy) 

2 {// 最 长 公共 递增 子 序列 

3 int [J[Jf{=new int[Ln 十 1][m 十 1]; 

4 for(int i=1;i<=n;it+){ 

5 int max 一 0; 

6 for(int j 王 15j< 一 mj;j 十 十 ){ 

有 {[J0]={[i—1]J0]; 

8 if(x[i—1]>y0—1]& 8 max<f[i—1J0]) max={[i—1]J0j]; 
9 if(x[i—1]==y[—1]) f[iJ[j]=max++1; 

10 + 

MW } 

12 int ret 一 0; 

3 for(int ij 一 1;i< 一 mi;i 十 十 ) if(ret<f[nj[i]) ret={[nj[i]; 
14 return ret; 


15 1} 


算法 需要 的 时 间 显 然 是 O(nm)。 
9.3.3 有 约束 最 长 公共 子 序列 


最 长 公共 子 序列 问题 是 生物 信息 学 中 序列 比 对 问题 的 一 个 特例 。 这 类 问题 在 数学 、 分 
子 生 物 学 .语音 识别 .气相 色谱 和 模式 识别 等 众多 领域 有 着 广泛 应 用 。 其 中 ,最 主要 的 应 用 
是 测量 基因 序列 的 相似 性 。 近 年 来 有 约束 最 长 公共 子 序列 问题 成 为 分 子 生 物 学 中 的 研究 热 
点 。 在 演化 分 子 生物 学 的 研究 中 发 现 , 某 个 重要 的 DNA 序列 片段 常 出 现在 不 同 的 物种 中 。 
在 测量 基因 序列 的 相似 性 时 ,如 果 需 要 特别 关注 一 个 具体 的 DNA 序列 片段 ,就 要 考查 带 有 
子 串 包含 约束 的 最 长 公共 子 序列 问题 。 这 个 问题 可 以 具体 表述 为 : 给 定 两 个 长 度 分 别 为 
和 六 的 序列 x[0..n 一 1] 和 y[0..m 一 1], 以 及 一 个 长 度 为 p 的 约束 字符 串 s[0..p 一 1]。 带 
有 子 串 包含 约束 的 最 长 公共 子 序列 问题 就 是 要 找 出 x 和 y 的 包含 ; 为 其 子 串 的 最 长 公共 子 
序列 。 

例如 ,如 果 给 定 的 序列 zx 和 > 分 别 为 z= 二 AATGCCTAGGC,y 二 CGATCTGGAC, 字 符 
串 ;二 GTA 时 , 子 序列 ATCTGGC 是 xz 和 y 的 一 个 无 约束 的 最 长 公共 子 序列 ,而 包含 * 为 
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其 子 串 的 最 长 公共 子 序 列 是 GTAC。 

首先 考查 一 个 特殊 的 带 有 子 串 包含 约束 的 最 长 公共 子 序列 问题 , 即 约束 字符 串 是 和 的 
最 长 公共 子 序列 的 后 级 的 情形 。 对 于 任何 (i,j,k) ,0 志 in 一 1,0j 寺 m 一 1,0k 志 p 一 1， 
将 z[0. .站 与 y[0.. 门 的 包含 y[0..k] 为 其 后 级 的 最 长 公共 子 序列 的 长 度 记 为 f(i,j,k), 则 
了 (i,j,) 满 足 如 下 动态 规划 递归 式 


fi—1,j—1,k—D)+l1 z[i] = yD] = sLk]J 
FG) = ie z[i] = yLjj] A k=—1 (9. 24) 
max{fG—1jR) ,fj—1R))}) zx[i] A yi] 


其 中 , 当 ;i 一 一 1 时 ,zx[0. . 门 为 空 串 ;j 二 一 1 时 ,y[0. . 门 为 空 串 ;& 二 一 1 时 ,s[0. .kj 为 空 串 。 

式 (9. 24) 的 边界 条 件 是 对 任何 (i,j,k) ,一 1 二 i<n 一 1, 一 1<j 二 m 一 1,0<k 过 p 一 1, 有 

fi,—1,—1)=/f(—1,j,—1)=0 
区 1,j,k) = fli,— 1,k) co 

事实 上 , 设 f(i,j,k)==1, 且 z[0. .7 一 1] 是 x[0.. 门 与 y[0.. 门 的 包含 *[0. .kj 为 其 后 级 
的 一 个 最 长 公共 子 序列 , 则 有 

(1) 当 z[ 杂 =y[j]==s[8J 时 ,由 于 s[0. .8j 是 z[0..1 一 1] 的 后 级 , 故 s[k]==z[/ 一 1]。 由 
此 可 知 ,x[0. .71 一 2j 是 x[0..i 一 1j 与 y[0..j 一 1j 的 包含 s[0. .& 一 1 为 其 后 缀 的 一 个 最 长 公 
共 子 序列 , 即 f(i,j,k)=f(i 一 1,j 一 1,&k 一 1) 十 1。 

(2) 当 z[ 站 =y[j] 且 zx[ 门 关 5[RJ 时 ,车 x[ 疏 =z[/ 一 1], 则 s[0. .J 不 是 xz[0.. 4 一 1] 的 后 
级 。 由 此 可 知 ,zx[ 门 关 z[1 一 1], 且 xz[0..71 一 2J 是 x[0..i 一 1] 与 y[0..j 一 1j 的 包含 s[0..&] 
为 其 后 级 的 一 个 最 长 公共 子 序列 , 即 f(i,j,k)= 二 f(i 一 1,j 一 1,k)。 

(3) 当 z[ 门 =y[ 门 且 k== 一 1 时 ,问题 等 价 于 无 约束 的 最 长 公共 子 序列 问题 ,因此 有 
fisjsk)=f0i—1,j—1,k)+1。 

(4) 当 Z[ 亡 关 y[jj 时 ,车 zx[ 门 关 z[7 一 1j, 则 z[0. .1 一 1J 是 xz[0..i 一 1] 与 yL0. .站 的 包 
含 s[0. .&] 为 其 后 级 的 一 个 最 长 公共 子 序列 , 即 f(i,j,k) 二 f(i 一 1,j,k)。 

类 似 地 ,车 y[ 门 考 z[7 一 1], 则 z[0. .1 一 1J 是 x[0.. 疏 与 y[0..j 一 1] 的 包含 s[0. .&] 为 其 
后 缀 的 一 个 最 长 公共 子 序列 , 即 f(i,j.&) 二 f(i,j 一 1,k)。 综 合 这 两 种 情形 ,有 f(i,j,k) 二 
max{f(i—1,j,k),f(i,j—1,k)}。 

在 一 般 情况 下 ,车 将 z[0..n 一 1j 与 yL0..m 一 1] 的 包含 s[0..p 一 1] 为 其 子 串 的 最 长 公 
共 子 序列 的 长 度 记 为 1, 且 x[0..7 一 1 是 x[0..n 一 1 与 y[0..m 一 1] 的 包含 s[0..p 一 1] 为 
其 子 串 的 一 个 最 长 公共 子 序列 , 且 z[7 一 p 十 1.. 7] 二 s[0..p 一 1]; 则 z[0..7 一 1] 可 以 分 成 
两 段 z[0. .7 和 z[7 十 1. .7 一 1]。 相 应 地 ,x 和 > 分 别 也 可 以 分 成 两 段 z[0. .站 和 zx[i 二 1.. 
n 一 1j,y[L0. .让 和 y[j 十 1..m 一 1], 使 得 z[0..7] 是 x[0.. 门 与 y[0.. 门 的 包含 s[0..p 一 1] 
为 其 后 级 的 一 个 最 长 公共 子 序列 , 目 z[7 十 1..71 一 1j 是 xz[i 十 1..n 一 1 与 yL[j 十 1..m 一 1j] 的 
一 个 无 约束 最 长 公共 子 序 列 。 因 此 ,如 果 将 xz[i..n 一 1] 与 yLj. .wm 一 1] 的 无 约束 最 长 公共 
子 序列 长 度 记 为 g(i,), 则 显然 有 

1= Was finjsp) + edit lit 1)} (9. 26) 

按照 式 (9. 24)、 式 (9. 25) 和 式 (9. 26) 可 以 计算 出 z[0..n 一 1] 与 y[0..m 一 1j 的 包含 

s[0. .2 一 1] 为 其 子 串 的 最 长 公共 子 序列 的 长 度 。 


(9.25) 
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从 递归 式 (9. 24) 可 以 看 出 ,计算 f(i,j,k) ,0 二 i<n 一 1,0 志 j 声 m 一 1,0 二 k 志 p 一 1, 需 要 
Omp) 时 间 。 计 算 zx[i..n 一 1j 与 yLj..m 一 1j 的 无 约束 最 长 公共 子 序列 长 度 g(i,j) 需 要 
On) 时间。 根据 已 经 计算 出 的 f(i,j,k) 和 g(i,7) 的 值 ,按照 式 (9. 26) 来 计算 最 优 值 ! 需 
要 Olnm) 时 间 。 因 此 ,整个 算法 所 需 的 计算 时 间 是 OGwmp)。 

与 带 有 子 串 包含 约束 的 最 长 公共 子 序列 问题 的 对 偶 问 题 是 带 有 子 串 排 斥 约束 的 最 长 公 
共 子 序列 问题 。 给 定 两 个 长 度 分 别 为 n 和 wm 的 序列 z[0..n 一 1] 和 y[L0..m 一 1j, 以 及 一 个 
长 度 为 p 的 约束 字符 串 s[0..p 一 1]。 带 有 子 串 排斥 约束 的 最 长 公共 子 序列 问题 就 是 要 找 
出 zx 和 y 的 不 含 s 为 其 子 串 的 最 长 公共 子 序列 。 

例如 ,如 果 给 定 的 序列 zx 和 y 分 别 为 z= 二 AATGCCTAGGC,y 二 CGATCTGGAC, 字 符 
串 ;二 TG 时 , 子 序列 ATCTGGC 是 zx 和 > 的 一 个 无 约束 的 最 长 公共 子 序列 ,而 不 含 * 为 其 
子 串 的 最 长 公共 子 序列 是 ATCGGC。 

在 下 面 的 讨论 中 用 到 一 个 关于 两 个 字符 串 的 有 用 的 函数 ec, 定义 如 下 : 对 于 如 何 字符 串 
z 和 约束 字符 串 * ,将 x 的 既是 其 后 级 又 是 s 的 前 级 的 最 长 字符 串 的 长 度 记 为 o(z,s)。 由 于 
约束 串 * 是 不 变 的 ,因此 在 不 会 引起 混淆 的 情况 下 ,将 o(z,s) 简 记 为 o(x)。 

对 于 任何 (i,j,k) ,0 二 in 一 1,0 志 j 志 mm 一 1,0 志 kp 一 1, 用 Z(i,j,k) 来 表示 zx[0. .站 
与 y[0.. 门 的 不 含 ;为 其 子 串 的 , 且 对 任何 z=EZ(i,j,k) 有 o(z) 二 =k 的 最 长 公共 子 序列 组 成 
的 集合 。2Z(i,j,k) 中 最 长 公共 子 序列 的 长 度 记 为 f(i,j,k)。z[0..n 一 1] 和 y[0..m 一 1] 的 
不 含 ;为 其 子 串 的 最 长 公共 子 序列 的 长 度 记 为 1。 显 而 易 见 ,如 果 已 经 计算 出 f(i,j,k)， 
则 有 


l= maxf(n—1,m—1,k) 《9. 27) 
ok<p 
设 
a(i,j,k) 一 max{f(i— 1,7—1,t) | ols[0..z]z[i]) = &} (9. 28) 
top 
则 fCi,j,&) 满 足 如 下 动态 规划 递归 式 
{fi—1,j,k),f(i,7— 1,k)} ri Yj 
ey a a ea 0 (9. 29) 
max{f(i—1,j— 1,k),1++a(i,j,k)} Xi = Yj 
式 (9. 29) 的 边界 条 件 是 ,对 任何 (i,j.k) ,一 1i<n 一 1, 一 1j 二 m 一 1,0 二 k 三 p, 有 
fi,—1k) = fC—1,j,k) =0 (9. 30) 


事实 上 , 设 f(i,j,k)==t 且 xz[0..t 一 1]E2Z(i,j,k), 则 对 任何 0 二 i 过 i,0j'j, 均 有 
f(i,j ,月 ) 碾 f(i,j,k)。 这 是 因为 ,如 果 过 是 z[0.. 诡 与 y[L0..j7 ] 的 不 含 ;为 其 子 串 , 且 
a(x) 二 的 公共 子 序列 , 则 x 也 是 zx[0. . 门 与 y[0.. 门 的 不 含 ;为 其 子 串 , 且 ol(z')==k 的 公 
共 子 序列 。 

(1) 当 zz[ 让 了 关 y[jj 时 ,有 xz[ 忆 了 关 z[t 一 1] 或 y[j] 关 z[t 一 1]。 

如 果 xz[ 门 去 z[t 一 1], 则 z[0..t 一 1J 是 x[0..i 一 1 与 y[0.. 门 的 不 含 * 为 其 子 串 , 且 
ol(z) 二 k 的 公共 子 序列 。 因 此 ,有 f(i 一 1,j,k) 之 t。 男 一 方面 ,f(i 一 1,j,kR) 寺 f(i,j,k) 二 t。 
由 此 可 知 ,f(i,j,k) 二 f(i 一 1,j,k)。 

如 果 y[ 门 疾 z[t 一 1], 则 类 似 地 可 以 得 到 f(i,j,k) 二 fi,j 一 1,k)。 

(2) 当 zx[ 让 二 yLjj 时 ,要 考查 x[i 二 yL[j] 二 zx[t 一 1] 和 zx[i 让 二 y[jj 关 zxLt 一 1j 这 两 种 不 
同情 况 。 
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如 果 zx[ 忆 =y[j]j 关 z[t 一 1, 则 z[0..t 一 1] 也 是 x[0..i 一 1 与 yL0..j 一 1] 的 不 含 ; 为 
其 子 串 且 c(z) 一 & 的 公共 子 序列 。 因 此 有 f(i 一 1,j 一 1,k) 之 t。 

另 一 方面 ,f(i 一 1,j 一 1,k) 声 f(i,j sk)=t。 由 此 可 知 ,f(i,j,k)==f(i 一 1,j 一 1,k)。 

如 果 z[ 妆 =y[ 门 =z[t 一 1j;, 则 f(i,j,k)=t 这 0, 且 z[0..t 一 1J 是 x[0.. 丫 与 y[L0.. 门 的 
不 含 * 为 其 子 串 , 且 o(z) 二 的 最 长 公共 子 序列 。 因 而 ,x[0..t 一 1j 也 是 x[0..i 一 1j 与 
3[0. .7 一 1 的 不 含 * 为 其 子 串 的 公共 子 序列 。 

设 o(z[0..t 一 2])==g 且 了 (i 一 1,j 一 1,9)==r, 则 xz[0..t 一 2] 是 x[0..i 一 1] 与 y[0. .7 一 
1] 的 不 含 s 为 其 子 串 , 且 o(x[0. .1 一 2]) 二 gq 的 公共 子 序列 。 因 此 ,有 

fi—1,j—1,g) =r 之 1—1 (9. 31) 

设 v[0..r 一 1]E2Z(i 一 1,j 一 1;g) 是 xz[0. .i 一 1] 与 y[0..j 一 1j] 的 不 含 :为 其 子 申 , 且 
olv[L0. .7 一 1])==q 的 一 个 最 长 公共 子 序列 , 则 oCv[0. .7 一 1])zx[i)==o(s[0..g 一 1]zx[i])=k。 
因此 ,wv[0..r 一 1jzx[ 站 是 x[0. .站 与 y[0. .站 的 不 含 * 为 其 子 串 , 且 oCv[0. .7 一 1]x[i])=k 
的 一 个 公共 子 序 列 。 所 以 有 


fli,jsk) 一 上 过 rr 十 1 (9. 32) 
结合 式 (9. 31) 和 式 (9. 32) 可 知 ,r 一 上 一 1。 
因此 ,xz[0..z 一 2j 是 zx[0..i 一 1 与 y[0..j 一 1] 的 不 含 ;为 其 子 串 , 且 oC(z[0. .1 一 2])=g 
的 最 长 公共 子 序列 。 也 就 是 说 ， 
fli,j,k) <1 十 max(7G 一 1,7—1,t) | oCs[Lo0..#]zx[i]) = &} (9. 33) 
另 一 方面 ,对 任意 0<t<<p, 若 f(i 一 1,j 一 1,t)==r 且 o(s[0..tjzx[i])==k, 则 对 任意 
vw[0..r 一 1]EZGi 一 1,j 一 1,t),v[L0..r 一 1jzx[ij 是 x[0.. 门 与 y[0.. 门 的 公共 子 序列 , 且 
olv[L0. .7 一 1jx[ 引 )= 二 k&。 由 于 wv[L0..r 一 1j 不 含 * 为 其 子 串 , 且 oC(v[0..7r 一 1]zx[i])=k<=p， 
所 以 v[0..r 一 1jzx[ 疏 是 x[0.. 疏 与 yL0. .站 的 不 含 ; 为 其 子 串 , 且 oCv[0..r 一 1jx[ 让 )=k 的 
最 长 公共 子 序列 。 因 此 ,f(i,j,k) 宇 1 十 r==1 十 f(i 一 1,j 一 1,), 即 


f(i,j,k) 之 1+ max{f(i— 1,7—1,) | oCs[Lo0. .tJzx[Li]) = &} (9. 34) 
由 式 (9. 33) 和 式 (9. 34) 可 知 
fisjsk) = 1+a(i,j,k) (9. 35) 
综合 当 [站 =y[jj 时 的 两 种 情形 ,可 知 
fisjsk) = max{f Gi—1,7— 1,k),1+a(i,j,k)} (9. 36) 


按照 式 (9. 29) 可 以 计算 出 xz[0..n 一 1] 与 y[0..m 一 1] 的 不 含 *[0. .pp 一 1] 为 其 子 串 的 
最 长 公共 子 序列 的 长 度 , 算 法 所 需 的 计算 时 间 是 O(nmp)。 


小 结 


本 章 重 点 介绍 了 串 和 序列 的 基本 概念 ,在 此 基础 上 讨论 了 子 串 搜索 问题 的 经 典 KMP 
算法 、 基 于 串 散 列 函 数 的 指纹 搜索 算法 .Rabin-Karp 算法 等 的 常用 算法 。 对 于 较 一 般 的 多 
子 串 搜 索 问题 ,介绍 了 AC 自动 机 , 即 Aho-Corasick 多 子 串 搜索 算法 。 后 级 数组 是 在 串 与 
序列 的 算法 中 的 一 个 重要 的 数据 结构 工具 。 高 效 构造 后 级 数组 的 算法 也 是 本 章 的 主要 内 
容 。 用 O(nlogn) 时 间 构 造 后 缀 数组 的 售 前 缀 算法 和 用 O(n) 时 间 构 造 后 级 数 组 的 DC3 分 治 


惠 与 序列 的 算法 


法 是 后 续 应 用 的 重要 基础 。 本 章 还 讨论 了 编辑 距离 问题 ,最 长 公共 单调 子 序列 问题 有 约束 
最 长 公共 子 序列 问题 等 与 串 和 序列 有 关 的 问题 和 算法 工具 ,这 些 工具 可 以 用 于 设计 比较 序 
列 的 高 效 算法 。 


习 题 


9-1 试 说 明 简 单子 串 搜索 算法 在 最 坏 情况 下 的 计算 时 间 复 杂 性 为 9(m(n 一 m 十 1))。 
9-2 设 z,y 和 > 是 3 个 串 , 且 满足 z = 和 > >*。 试 证 明 : 
(1) 若 |z| 委 ly|, 则 zz yy。 
(2) 若 |z| 辫 |y|, 则 > xz。 
(3) 车 |z|=|y|, 则 z=y。 
9-3 KMP 算法 通过 模式 串 的 前 级 函数 , 较 好 地 利用 了 搜索 过 程 中 的 部 分 匹配 信息 ,从 而 
提高 了 效率 。 然 而 ,在 某 些 情况 下 ,还 可 以 更 好 地 利用 部 分 匹配 信息 。 例 如 ,考查 
图 9-10 中 ,KMP 算法 对 主 串 aaabaaaab 和 模式 串 aaaab 的 搜索 过 程 。 


alalalblalalalalb 


中 1 | 类 


alalala 


Ea 


了 


9-10 ”改进 前 缀 函数 


在 图 9-10(a) 中 匹配 失败 后 , 按 前 级 函数 指示 继续 做 了 图 9-10(b) 一 (d) 的 比较 后 ,最 
后 在 图 9-10(e) 找 到 一 个 匹配 。 事实 上 图 9-10(b) 一 (d) 的 比较 都 是 多 余 的 。 因 为 模 
式 串 在 位 置 0,1,2 处 的 字符 和 位 置 3 处 的 字符 都 相等 ,因此 不 需要 再 和 主 串 中 位 置 3 
处 的 字符 比较 ,而 可 以 将 模式 一 次 向 右 滑动 4 个 字符 ,直接 进入 图 9-10(e) 的 比较 。 这 
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9-8 


9-9 


就 是 说 ,在 KMP 算法 中 遇 到 p[j 十 1] 关 i[ 让 上 且 p[j 十 1 二 pLnext[jj] 十 1 时 ,可 一 次 向 
右 滑 动 j 一 nextLnext[j]] 个 字符 ,而 不 是 j 一 next[j 个 字符 。 根 据 此 观察 ,设计 一 个 
改进 的 前 级 函数 ,使 得 遇 到 上 述 特 殊 情 况 时 效率 更 高 。 

修改 算法 KMP-Matcher, 使 其 能 找到 模式 串 p 在 主 串 t 中 的 所 有 匹配 位 置 。 

假设 模式 串 p 中 所 有 的 字符 均 不 相同 。 说 明 如 何 修 改 简单 子 串 搜 索 算法 ,使 其 计算 
时 间 为 O(n) ,其 中 双 为 主 串 i 的 长 度 。 

设 主 串 上 和 模式 串 p 分 别 是 从 d(d 宇 2) 元 字符 集 风 = 10,1,…,d 一 1) 中 随机 字符 组 成 
的 长 度 为 n 和 wm 的 字符 串 。 试 证 明 简单 子 串 搜索 算法 所 做 比较 次 数 的 期 望 值 为 : 


一 <2(n 


由 此 可 见 , 对 于 随机 选取 的 字符 串 ,简单 子 串 搜索 算法 还 是 十 分 有 效 的 。 

假设 允许 模式 串 p 中 可 以 出 现 能 与 任意 字符 串 ( 包 括 长 度 为 0 的 空 串 ) 匹 配 的 间 际 字 
符 令 。 例 如 ,模式 串 是 ab ObaQc, 可 在 主 串 cabccbacbacab 产生 如 图 9-11 所 示 的 
匹配 。 


人 m 十 D) 1 庆 沙 让 


olec 


(b) 
9-11 带 间 际 字符 的 模式 串 


间 际 字符 今 可 在 模式 串 中 出 现任 意 多 次 ,但 不 允许 在 主 串 中 出 现 。 试 设计 一 个 多 项 
式 时 间 算 法 ,确定 在 主 串 中 能 否 找到 与 模式 串 p 匹配 的 子 串 , 并 分 析 算 法 的 计算 时 间 
复杂 性 。 

设 模 式 串 p 和 主 串 上 的 串 接 为 pt。 试 说 明 如 何 利用 pi 的 前 缀 函数 来 计算 模式 串 p 在 
主 串 1 中 出 现 的 位 置 。 

试 设计 一 个 线性 时 间 算 法 ,确定 一 个 串 上 是否 为 男 一 串 1 的 循环 旋转 。 例 如 ,arc 与 
car 互 为 循环 旋转 。 


9-10 在 字符 串 集合 己 的 AC 自动 机 工 中 ,状态 结 点 s 所 表示 的 字符 串 是 从 根 结 点 到 的 


路 径 上 各 边 的 字符 依次 连接 组 成 的 字符 串 a(s)。 设 s 和 zt 是 T 中 两 个 结 点 , 且 二 
al(s) ,v 二 a(t)。 试 证 明 ,f(s) 二 t 当 且 仅 当 wv 是 字符 串 p;,0<i<k 的 所 有 前 缀 中 x 的 
最 长 真 后 绥 。 

设 ;是 字符 串 集 合 P 的 AC 自动 机 中 的 状态 结 点 , 且 wu 二 a(s)。 试 证 明 ,vE output 
(s) 当 且 仅 当 vEP 上 且 wv 是 w 的 后 级 。 

试 设计 一 个 后 缀 数组 类 。 用 售 前 级 算法 构造 后 级 数组 ,并 支持 以 下 运算 : 

(1) length(); // 返 回 后 绥 数 组 长 度 

(2) select(int 2 让);  // 返 回 sa[ 让 


9-16 
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(3) index(int 72); // 返 回 rank[i] 
(4) llep(int 7); // 返 回 lcp[i 
试 说 明 如 何 对 最 长 公共 前 组 数组 lcp 做 适当 预 处 理 , 使 得 最 长 公共 扩展 查询 在 最 坏 
情况 下 需要 O(1) 时 间 。 
设 字 符 串 1 的 后 缀 数组 和 最 长 公共 前 级 数组 分 别 为 sa 和 lcp。 对 于 非 负 整数 0 过 /三 
r,t 的 后 级 S, 和 S, 的 最 长 前 级 的 长 度 为 lce(1,r)。 设 z=sa [1j,z 二 sa [7 门 , 则 
sa[zj 二 71,sa[xj] 二 +r。 不 失 一 般 性 ,可 设 z+ 二 >。 试 证 明 lce(1,r) 具 有 如 下 性 质 。 

lce(1,7) = min {lce(sa[y],sa[y+ 1])} = min {lcpLy]} (9. 37) 
设 字符 串 1 的 后 级 数组 和 最 长 公共 前 缀 数组 分 别 为 sa 和 lcp。 数 组 hh 定义 为 h[ 疏 二 
lcp[sa 收 [让] ,0 志 i 二 nn 一 2。 试 证 明 ,如 果 7 实 之 1, 则 

h[i++1] 宇 h[i] 一 1 (9. 38) 

设 字符 串 1 和 pp 的 长 度 分 别 为 mx 和 nn。t 的 后 级 数组 为 sa。 试 说 明 如 何 利用 + 的 后 
级 数组 ,搜索 给 定 字符 串 p 在 t 中 出 现 的 所 有 位 置 。 要 求 算法 在 最 坏 情 况 下 的 时 间 
复杂 性 为 O(mlogn)。 
设 字符 串 上 和 pp 的 长 度 分 别 为 mw 和 nn。t 的 后 级 数组 和 最 长 公共 前 级 数组 分 别 为 sa 
和 lcp。 试 说 明 如 何 利用 zt 的 后 级 数组 和 最 长 公共 前 级 数组 ,搜索 给 定 字符 串 p 在 t 
中 出 现 的 所 有 位 置 。 要求 算法 在 最 坏 情 况 下 的 时 间 复 杂 性 为 O(m 十 logn)。 


CD 


第 章 
-10 算法 优化 策略 


本 章 通过 具体 实例 介绍 算法 设计 中 常用 的 算法 优化 策略 。 
10.1 算法 设计 策略 的 比较 与 选择 


考虑 最 大 子 段 和 问题 如 下 。 
给 定 由 个 整数 (可 能 为 负 整 数 ) 组 成 的 序列 a ,as,… ,a,, 求 该 序列 形 如 2 a 的 子 朋 
和 的 最 大 值 。 当 所 有 整数 均 为 负 整数 时 定义 其 最 大 子 段 和 为 0。 依 此 定义 ,所 求 的 最 优 
值 为 


max{ 0 Max >) 


<i<j<nk 


例如 , 当 (g ,azsyassasrassas) 二 (一 2,11, 一 4,13, 一 5, 一 2) 时 ,最 大 子 段 和 为 
4 
2) a = 20。 
k=2 


10.1.1 最 大 子 段 和 问题 的 简单 算法 


对 于 最 大 子 段 和 问题 ,有 多 种 求解 算法 。 先 讨论 一 个 简单 算法 如 下 ,其 中 用 数组 a[] 存 
储 给 定 的 个 整数 a ,as，… ,a,。 
public static int maxSum() 


{ 


int n=a. length—1; 


int sum 一 0; 
for (int i 一 1;i< 一 nji 十 十 ) 
for (int j 一 ij 一 一 njj 十 十 ) 
{ 
int thissum 一 0; 
for (int k 一 i;k< 一 j;k 十 十 ) thissum 十 一 a[k]; 
if (thissum> sum) 
{ 
sum 一 thissumy 


besti=i; 
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bestj=j; 
} 
} 
return sum; 


} 

从 这 个 算法 的 3 个 for 循环 可 以 看 出 它 所 需 的 计算 时 间 是 O(n*)。 事 实 上 ,如 果 注 意 到 
和 1 
>) ai = 十 ai, 则 可 将 算法 中 的 最 后 一 个 for 循环 省 去 ,避免 重复 计算 ,从 而 使 算法 得 
k=i k=i 
以 改进 。 改 进 后 的 算法 可 描述 为 ; 


public static int maxSum() 
{ 
int n=a. length 一 1; 
int sum 一 0; 
for (int ij 一 1;i< 一 nji 十 十 ) 
{ 
int thissum 一 0; 
for (int j=i;j<=n;j++) 
{ 
thissum 十 一 a[j]; 
if (thissum> sum) 
{ 
sum= thissum; 
besti=i; 
best 一 j; 
} 
} 
return sum; 


} 


改进 后 的 算法 显然 只 需 OC2 ) 的 计算 时 间 。 上 述 改 进 是 在 算法 设计 技巧 上 的 一 个 改 
进 , 能 充分 利用 已 经 得 到 的 结果 ,避免 重复 计算 ,从 而 节省 了 计算 时 间 。 


10.1.2 最 大 子 段 和 问题 的 分 治 算法 


事实 上 ,针对 最 大 子 段 和 这 个 具体 问题 本 身 的 结构 ,还 可 以 从 算法 设计 的 策略 上 对 上 述 
OGr) 计 算 时 间 算 法 加 以 更 深刻 的 改进 。 从 这 个 问题 的 解 的 结构 可 以 看 出 , 它 适合 于 用 分 

如 果 将 所 给 的 序列 a[1:n] 分 为 长 度 相等 的 2 段 a[1:n/2j] 和 a[Ln/2 十 1:nj, 分 别 求 出 这 
2 段 的 最 大 子 段 和 , 则 a[1:nj 的 最 大 子 段 和 有 以 下 3 种 情形 : 

(1) a[Ll :站 的 最 大 子 段 和 与 a[1:n/2] 的 最 大 子 段 和 相同 。 

(2) a[1:nj 的 最 大 子 段 和 与 aL[n/2 十 1:n] 的 最 大 子 段 和 相同 。 


(3) a[1:nj 的 最 大 子 段 和 为 Yas , 且 1&i<n/2,n/2+1<j<n。 
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上 述 (1) 和 (2) 这 两 种 情形 可 递归 求 得 .对 于 情形 (3) ,容易 看 出 ,a[n/2] 与 a[n/2 十 1] 
n/2 


在 最 优 子 序列 中 。 因 此 ,可 以 在 a[1:n/2j] 中 计算 出 s 一 ,Dax >)a[k], 并 在 a[n/2 十 1:] 中 


<i<n2 人 


计算 出 二 _max 了》 a[kJ, 则 5 十 ss 即 为 出 现 情形 (3) 时 的 最 优 值 . 据 此 可 设计 出 求 最 


/2+t1SiCn pt 


大 子 段 和 的 分 治 算法 如 下 : 


private static int maxSubSum(int left, int right) 
{ 
int sum 一 
if (left== right)sum=a[left]>0? a[left]:0; 


else { 


int center= (left+ right)/2; 
int leftsum= maxSubSum(left,center); 
int rightsum 一 maxSubSum(center 十 1,right); 
int sl=0; 
int lefts=0; 
for (int i=center;i> =left;i——) 
{ 

lefts++=a[i]; 

if (lefts>s1)sl= lefts; 
} 
int s2=0; 
int rights= 0; 
for (int i 一 center 十 1;i< 一 right;i 十 十 ) 
{ 

rights+=a[i]; 
if (rights>s2)s2= rights; 

} 
sum 一 sS1 十 s2; 

if (sum<leftsum)sum= leftsum; 

if (sum<rightsum)sum= rightsum; 

a 


return sum; 


public static int maxSum() 


{ 
return maxSubSum(1,a. length 一 1); 
} 
该 算法 所 需 的 计算 时 间 T(n) 满 足 典 型 的 分 治 算法 递归 式 


全 ne 
T(z) = 
2T(n/2) + O(n) n>c 


解 此 递归 方程 可 知 ,T(n) 二 O(nlogn)。 
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在 对 上 述 分 治 算法 的 分 析 中 注意 到 ,车 记 [ 门 二 max{ > a[A]) ,1 之 j 过 , 则 所 求 的 
最 大 子 段 和 为 
Max > [LA] = max max de [kj] = max bLj] 


由 5[ 门 的 定义 易 知 ， 当 6[j 一 1]>0 时 6b[ 站 = pr 否则 5b[ 门 =a[ 门 。 由 此 可 
得 计算 5[ 门 的 动态 规划 递归 式 
b[j] = max{6[j —1j+aLj],alj]}, 1<j<n 
据 此 ,可 设计 出 求 最 大 子 段 和 的 动态 规划 算法 如 下 : 


public static int maxSum() 
{ 
int n 一 a. length 一 1; 
int sum 一 0， 
b=0; 
for (int i 王 1;i< 一 nj;i 十 十 ) 
{ 
让 (b>0) b+=a[i]; 
else b=a[i]; 
if (b>sum)sum=b; 
} 
return sum; 


站 
上 述 算法 显然 需要 O(n) 计 算 时 间 和 O(n) 空间 。 


10.1.4 最 大 子 段 和 问题 与 动态 规划 算法 的 推广 


最 大 子 段 和 问题 可 以 很 自然 地 推广 到 高 维 的 情形 。 

1 最 大 也 矩阵 和 问题 

最 大 子 矩 阵 和 问题 ; 给 定 一 个 由 行 ” 列 的 整数 徐 阵 a, 试 求 矩 阵 e 的 一 个 子 矩阵 ,使 其 
各 元 素 之 和 为 最 大 。 

最 大 子 和 矩阵 和 问题 是 最 大 子 段 和 问题 向 二 维 的 推广 。 用 二 维 数组 [1:m][l: 四 表示 给 
定 的 m 行 n 列 的 整数 矩阵 。 子 数组 a[ 订 :i2J[j1:j2] 表 示 左 上 角 和 右 下 角 行列 坐标 分 别 为 
( 计 ,j) 和 (zi2,J72) 的 子 和 矩阵 ,其 各 元 素 之 和 记 为 

ee DE 

最 大 子 矩 阵 和 问题 的 最 优 值 为 _max (71,;2,j1,j2)。 

如 果 用 直接 枚 举 的 方法 解 最 大 子 箱 阵 和 问题 ,需要 Onz2) 时 间 。 注 意 到 ， 

max s(il,i2,j1,j2)= max { max s(il,i2,j1l,j2)} = ca. t(i1,i2) 


1<il<i2<m l1<il<i2<m 1l1<jl<j2<n 
1Sj1<j2<n 
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其 中 


11,i2) 一 max_ si1,i2,j1,j2) = ,ma - 3 J0;] 


1<j1<j2<n j= i 


认 


设 6[ 门 = 之 < [GJ, 则 


1(il,i2) = max 六 6b[j] 


1<i<ji2<n fA 
容易 看 出 ,这 正 是 一 维 情形 的 最 大 子 段 和 问题 。 由 此 ,借助 于 最 大 子 段 和 问题 的 动态 规 
划算 法 maxSum ,可 设计 出 解 最 大 子 和 矩阵 和 问题 的 动态 规划 算法 maxSum2 如 下 : 
public static int maxSum2(int m，int n) 
{ 
int sum 一 0; 
int [] b = new int [n+1]; 
for (int i=1;i<=m;i++) 
{ 
for (int k 一 1;k< 一 njk 十 十 ) b[k]=0; 
for (int j 王 二 < 一 m3j 十 十 ) 
{ 
for (int k 王 1;k< 一 nik 十 十 ) bLk] 十 =a[j][k]， 
int max 一 maxSum(b); 
if (max> sum)sum= max; 
} 
} 
return sum; 


} 


由 于 解 最 大 子 段 和 问题 的 动态 规划 算法 maxSum 需要 O(n) 时 间 , 故 算法 maxSum2 的 
双重 for 循环 需要 OCm?n) 计 算 时 间 。 从 而 算法 maxSum2 需要 Olm?n) 计 算 时 间 。 特 别 地 ， 
当 mm 二 O(n) 时 ,算法 maxSum2 需要 O(n ) 计 算 时 间 。 

2. 最 大 m 子 段 和 问题 

最 大 m 子 段 和 问题 ; 给 定 由 个 整数 (可 能 为 负 整 数 ) 组 成 的 序列 al ,as,… ,a ,以 及 一 
个 正 整 数 ,要 求 确定 序列 wm ,as,…,a, 的 m 个 不 相交 子 段 ,使 这 m 个 子 段 的 总 和 达到 
最 大 。 

最 大 m 子 段 和 问题 是 最 大 子 段 和 问题 在 子 段 个 数 上 的 推广 。 或 者 换 句 话说 ,最 大 子 段 
和 问题 是 最 大 m 子 段 和 问题 当 mm 二 1 时 的 特殊 情形 。 

设 5(i, 站 表示 数组 a 的 前 j 项 中 i 个子 段 和 的 最 大 值 , 且 第 i 个 子 段 售 a[j](1<i<m， 
i<j<n)。 则 所 求 的 最 优 值 显然 为 max 6 (m,7)。 与 最 大 子 段 和 问题 类 似 地 ,计算 50i,j)) 的 
递归 式 为 

psj) = max{b(i,j— 1) taLj], max 6(i— 1;2)+aD]} QQ<i<mi<in) 
其 中 ,5(i,j 一 1) 十 a[ 站 项 表示 第 i 个 子 段 会 a[j 一 1], 而 , max b(i 一 1,t) 十 a[j 站 项 表示 第 i i 
个 子 段 仅 含 a[j]。 初 始 时 ,5(0,7)==0, (1&j<<n) ;6(i,0)=0,(1<i<m)。 
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根据 上 述 计算 5(i, 站 的 动态 规划 递归 式 ,可 设计 和 解 最 大 m 子 段 和 问题 的 动态 规划 算法 
如 下 : 


public static int maxSum(int m) 
{ 
int n=a. length 一 1; 
if (n<m || m=<1) return 0; 
int [J[] b=new int [m 十 1][n 十 1]， 
for (int i=0; i<—m; i 十 十 ) b[ij[0]=0; 
for (int j=1; j<=n; j++) b[0J[j]=0; 
for (int ji 一 1;i< 一 mii 十 十 ) 
for (int j 王 ij 一 一 n 一 m 十 ij 十 十 ) 
让 (>D 
{ 
b[iJ0]=b[i]0—1]+ali]; 
for (int k 一 i 一 1;k 一 j;k 十 十 ) 
if (b[iI0G]<b[i—1JCk]+a[j]) 
b[iJ0]=b[i—1JCk]+a[i]; 


} 
else b[iJ0]=b[i—1J0—1]+a[lj]; 
int sum 一 0; 
for (int j=m;j<=n;j 二 十 ) 
i (sum<b[m][j]) sum=b[m][j]; 
return sum; 


} 


上 述 算法 显然 需要 OCmnm) 计 算 时 间 和 Olmn) 空 间 。 

注意 到 在 上 述 算 法 中 ,计算 65[ 妇 [jj 时 只 用 到 数组 5 的 第 i 一 1 行 和 第 i 行 的 值 。 因 而 算 
法 中 只 要 存储 数组 5 的 当前 行 ,不 必 存 储 整个 数组 。 另 一 方面 ,max 6(i 一 1,0) 的 值 可 以 在 
计算 第 i 一 1 行 时 预先 计算 并 保存 起 来 。 计 算 第 i 行 的 值 时 不 必 重 新 计算 ,节省 了 计算 时 间 
和 空间 。 按 此 思想 可 对 上 述 算法 做 进一步 改进 如 下 : 


public static int maxSum(int m) 
{ 
int n=a. length—1; 
if (n<m || m=<1) return 0; 
int [] b=new int [n+1]; 
int [] c=new int [n 十 1]; 
b[0] 一 0; 
c[1]=0; 
for (int ij 一 1;i< 一 mi;i 十 十 ) 
b[i]=b[i—1j+a[i]; 
cLi—1]=b[i]; 
int max=b[]; 


for (int j=i 计 1;j< 一 i 十 na 一 mi;j 十 +) 
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{ 
b[ 订 一 bUj 一 吉之 cUj 一 1]? bi—1]+al]:c0i—1]+a[j]; 
cL[j—1]=max; 
if (max<b[j]) max= b[j]; 
} 
cLitn—m]=max; 
} 
int sum=0; 
for (int j=m;j<=—n;j 二 十 ) 
if (sum<b[j])sum=b[j]; 
return sum; 


} 


上 述 算法 需要 OCm(n 一 m)) 计 算 时 间 和 0O(xw) 空 间 。 当 mm 或 n 一 m 为 常数 时 ,上 述 算法 
需要 O(n) 计 算 时 间 和 O(n) 空间 。 


10.2 动态 规划 加 速 原理 


本 节 以 货物 储 运 问题 为 例 讨论 动态 规划 加 速 原理 。 对 一 类 常见 的 动态 规划 问题 ,利用 
其 四 边 形 不 等 式 性 质 , 将 计算 时 间 从 OG ) 降 至 OC)。 


10.2.1 货物 储 运 问题 


一 个 铁路 沿线 顺序 存放 着 n 堆 装 满 货物 的 集装箱 。 货 物 储 运 公司 要 将 集装箱 有 次 序 

wpa 堆 。 规 定 每 次 只 rap nap atest he 所 需 的 运输 费用 与 新 

一 堆 中 集装箱 数 成 正比 。 给 定 各 堆 的 集装箱 数 ,试制 定 一 个 运输 方案 ,使 总 运输 费用 
~ 

设 n 堆 货物 从 左 到 右 编 号 为 1,2,…,n。 各 堆 货 物 集装箱 数 为 a[1:nj。 

1. 最 优 子 结构 性 质 

对 于 a[1:nj 的 一 个 最 优 合 并 方式 , 设 其 在 a[k] 和 a[k 十 1] 之 间断 开 , 则 其 合并 方式 为 
(Ca[Ll:k]) (a[Lkt+1:n])). 

容易 看 出 ,此 时 a[1:&] 和 a[k 十 1:nj 的 合并 方式 也 是 最 优 的 , 即 该 问题 具有 最 优 子 结构 
性 质 。 


2. 递归 关系 
设 合并 a[i: 门 ,1i<j 二 n, 所 需 的 最 少 费 用 为 m[i,j]j], 则 原 问 题 的 最 优 值 为 m[1,nj。 
由 最 优 子 结构 性 质 可 知 ， 
0 En 
m[i,jj = 0 


min {mli, k—1]+mLk, + De [a]} i<j 


上 式 给 出 了 计算 m[i, 门 的 递归 式 ， 同时 还 确定 了 合并 的 断 开 位 置 ， 可 将 记录 在 s[i， 
州 中 ,便于 在 计算 出 最 优 值 后 ,根据 sLi,jj 中 记录 的 断 开 位 置 构造 出 最 优 解 。 


上 述 递归 式 中 的 ya[ 跨 也 可 递归 地 计算 . 设 上 [ 问 二 > a[],i 二 1…436[0] 二 0; 则 


t=1 
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10.2.2 算法 及 其 优化 


货物 储 运 问题 的 动态 规划 递归 式 是 下 面 更 一 般 的 递归 计算 式 的 特殊 情形 。 
设 w(i, 站 ER,1 志 i 过 j 二 n。 且 mx(i, 站 的 递归 计算 式 为 
ee t= 
™[i,j] = a + min{m[isk—1]+m[kj]) i<j 
1. Om ) 时 间 算 法 
根据 递归 式 , 按 通常 方法 可 设计 计算 m(i,j) 的 动态 规划 算法 如 下 : 


public static void dynamicProgramming(int n, float [J[Jm, int [J[]s, float [J[Jw) 
{ 
for (int i=1; i<=n; i 十 十 ) 
{ 
m[i][]=0; 
s[iJ[i]=0; 
} 
for (int r=1; r<=n; r 十 十 ) 
for (int i=1; i<=n—r; i 十 十 ) 
{ 
int j 一 i 十 r; 
w[i][j]= weight(i,j); 
mi 一 mLi 十 1][j]， 
s[iJ0]=i; 
for (int k=i 二 1; k 一 j; k 十 十 ) 
{ 
float t 一 m[ 训 [k] 十 m[k 十 1]D]; 
证 (t< 一 mr]) { 
m[i0]=t; 
s[iJ0]=k;} 
} 
m[i]J0]+=wLiJ[j]; 


} 


算法 dynamicProgramming 需要 O(n ) 计 算 时 间 和 0O(x?) 空 间 。 
2. 四 边 形 不 等 式 
在 上 述 计算 m(i, 站 的 递归 式 中 , 当 函 数 zw(i,7) 满 足 
wis))) + wi ,i) Sw ,N+w(i,j’), i i 
时 , 称 ww 满足 四 边 形 不 等 式 。 
当 函 数 w(i, 丫 满足 w(i, 门 过 w(i,j ) ,ii 过 j 过 j' 时 , 称 W 关于 区 间 包 含 关系 单调 。 
对 于 满足 四 边 形 不 等 式 的 单调 函数 zm, 可 推 知 由 递归 式 定义 的 函数 mx(i,j) 也 满足 四 边 
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形 不 等 式 , 即 
m(is))+m(i,j) Cm,)) +m(i,j’), 六 
这 一 性 质 可 用 数学 归纳 法 证 明 如 下 。 
对 四 边 形 不 等 式 中 的 “长 度 ”=j "一 i 用 数学 归纳 法 。 
当 i 二 i 或 j == 六 时 ,不 等 式 显然 成 立 。 由 此 可 知 , 当 /三 1 时 ,函数 m 满足 四 边 形 不 
等 式 。 
下 面 分 两 种 情形 进行 归纳 证 明 。 
1) 情形 1: i<i =j<j 
在 这 种 情形 下 ,四 边 形 不 等 式 简化 为 下 面 的 ( 反 ) 三 角 不 等 式 
m(is) mj ) mi,j) 
设 k==max{tlm(i,j)=m(i,t—1)+m(t,j )+w(i,j )) ,再 分 & 三 j 或 k 三 j 两 种 对 称 
情形 。 
(1) 情形 1. 1: &<j。 
此 时 有 mGi,j 二 wi,j 十 m(i,k 一 1) 十 m(k,j’)。 因 此 有 
mi tm Swi,)) cmik— 1) +mk,j) +m(j,j) 
Swisj +mik m1) +mk,)) +m(i,i) 
wij) tm(ik—1)+mk,j) 


= m(i,j’) 

(2) 情形 1. 2: & 二 j。 
证 明 与 情形 1. 1 类 似 。 
2) 情形 2: i<i 过 j 过 i 
设 

y= max{t | m(i,j) = mi ,to—1)+m(t,)) + wi ,7)} 

z= max{t pt ) = m(i,t—1)+m(t,j) + wii, )} 
仍 需 再 分 两 种 情形 讨论 >z 委 y 或 >>y。 只 讨论 x 三 y 的 情形 ,< 二 y 的 情形 是 对 

称 的 。 


首先 注意 到 由 y 和 x 的 定义 有 < 三 y<j 且 i 二 z。 由 此 有 
m(i,)) +m(i’,j’) 
wi +misz—1) m+ wj ) +mi ,ym—1) my ) 
wij) Twi +mi ,yO— +mi,z—1)+m(z,j) +m(y,j) 


Swij) Fw mi ,yO— D+mi,z—1)+m(y,) +m(z,j) 


= m(i,j) mi,j) 

综 上 所 述 ,由 数学 归纳 法 即 知 ,m(i,j) 满 足 四 边 形 不 等 式 。 

定义 5(i, 门 二 max{klm(i, 站 二 m(isk 一 1) 十 mk,)) 十 Ww(i,j)) ,由 函数 mx(i, 门 的 四 边 
形 不 等 式 性 质 可 推出 函数 s(i,j) 的 单调 性 , 即 

sD Rs(ij+ Dit+1j 二 + i<j 

事实 上 , 当 i=j 时 ,单调 性 不 等 式 显然 成 立 。 因 此 ,只 要 讨论 i=j 的 情形 。 由 于 对 称 
性 ,只 要 证 明 s(i,j) 志 s(i,j 十 1)。 

为 了 便于 讨论 , 记 mmGi,))=m(i,k 一 1) 十 m(k,j) 十 w(i,j)。 
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由 sG 力 的 定义 可 知 ,为 证 明 sG, 力 和 s(Gij 十 1) ,只 要 证 明 对 所 有 ;is 必 入 ) 有 
Wp (ij 去 zxGij) 草 涵 me 人 十 1) 壕 zosGj 十 1) 的 


事实 上 ,可 以 证 明 一 个 更 强 的 不 等 式 
mld — misj) mi 二 + 1) — mij 二 1) 
或 等 价 地 
mis me isjt+1) mij+1) +me (iI) 
将 这 4 项 用 它们 的 定义 展开 可 得 
72( 有 RD) 十 (人 十 1) mk ,7 tm(k,j+1) 
这 正 是 在 k<k'j 达 j 十 1 时 的 四 边 形 不 等 式 。 
综 上 所 述 , 可 得 到 如 下 重要 结论 : 
当 w 是 满足 四 边 形 不 等 式 的 单调 函数 时 ,函数 *(i,7) 单 调 。 
3. 加 速算 法 
根据 前 面 的 讨论 , 当 w 是 满足 四 边 形 不 等 式 的 单调 函数 时 ,函数 s(i, 站 单调 ,从 而 
Dintm(ik —1)+m(k,j)} = DR 人 一 十 友人 
由 此 可 对 算法 dynamicProgramming 做 如 下 改进 : 
public static void speedDynamicProgramming(int n, float [J[ Jjm, int [J[]s, float [J[]w) 
{ 
for (int i=1; i<=n; i 十 十 ) 
{ 


m[iJ[i]=0; 
s[iJ[i]=0; 
} 
for (int r=1; r<n; r++) 
for (int i=1; i<=n— r; i 十 十 ) 
{ 
int j=i+r, 
l=s[iJ[0—1], 
j1=s[i+1]J0]; 
w[i[j]= weight(i,j); 
m[J0]=m[Ci1]+m[il+1J0]; 
s[i[0]=il; 
for (int k 一 这 十 1; k<=jl; k 十 十 ) 
{ 
float t=m[iJ[kj+m[k+1J0]; 
if (t{<=m[iJ[0]) 
{ 
m[iJ0]=t; 
s[iJ0]=k; 
} 
} 
m[iJ0]+=wLi0]; 
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改进 后 算法 speedDynamicProgramming 所 需 的 计算 时 间 为 
[smd 时 md 


OD Fr 


r=0 i=1 


oO(T Fr 十 350 一 rr 十 1 9) s(1,7))) 


= O(n’:) 


对 于 货物 储 运 问题 ,有 w(i,j) 二 》) a[ 门 。 

w(i, 站 显然 满足 wGi, 门 十 w(i ,j=w(i, 门 十 w(i,j ,ii < 之 jj 以 及 w(i' ,站 
夺 w(i,j ) ,i<i <<j 三 )。 因 而 w(i, 站 是 满足 四 边 形 不 等 式 的 单调 函数 。 根 据 前 面 的 讨论 ， 
可 用 算法 speedDynamicProgramming 解 货物 储 运 问题 ,所 需 的 计算 时 间 为 O(n?)。 


10.3 问题 的 算法 特征 


进一步 考查 货物 储 运 问题 可 以 发 现 该 问题 具有 特殊 性 质 有 助 于 设计 有 效 算 法 。 本 节 通 
过 对 货物 储 运 问题 的 更 深入 分 析 ,挖掘 问题 的 算法 特征 ,设计 出 更 有 效 的 算法 ,将 计算 时 间 
从 上 一 节 中 算法 的 OG ) 降 至 O(nlogn) ,成 为 一 个 最 优 算法 。 通 过 该 实例 的 分 析 , 展 示 利 
用 问题 的 算法 特征 ,优化 算法 计算 时 间 和 空间 的 一 般 策略 。 


10.3.1 贪心 策 略 


设 货物 储 运 问题 各 堆 集 装 箱 数 依 序 分 别 为 5,3,4,1,3,2,3,4。 采 用 每 次 合并 集装箱 数 
最 少 的 相 邻 2 堆 货物 的 贪心 策略 ,其 合并 过 程 如 图 10-1 所 示 。 
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(a) (b) 
图 10-1 货物 储 运 问题 的 贪心 算法 


该 问题 的 最 优 值 为 74。 可 见 采 用 上 述 贪心 策略 得 不 到 最 优 解 。 
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10.3.2 对 贪心 策略 的 改进 


从 图 10-1 可 以 看 出 ,采用 贪心 策略 每 次 合并 最 小 相 邻 结 点 对 。 适 当 放 松 相 邻 性 约束 ， 
引入 相 容 结 点 对 概念 。 如 图 10-1 所 示 ,原始 结 点 用 方形 结 点 表示 ,合并 生成 的 结 点 用 圆 形 
结 点 表示 。 在 合并 过 程 中 , 相 容 结 点 对 之 间 没 有 方形 结 点 。 图 10-2 的 结 点 合并 过 程 是 对 图 
10-1 贪心 算法 的 修正 。 该 算法 采取 的 合并 策略 是 合并 当前 最 小 相 容 结 点 对 。 

最 小 相 容 结 点 对 a[ 门 和 a[j] 是 满足 下 面条 件 的 结 点 对 : 

(1) 结 点 a[ 让 和 a[j] 之 间 没 有 方形 结 点 。 

(2) 在 所 有 满足 条 件 (1) 的 结 点 中 a[ 疏 十 a[ 站 的 值 最 小 。 

(3) 在 所 有 满足 条 件 (1) 和 (2) 的 结 点 中 下 标 i 最 小 。 

(4) 在 所 有 满足 条 件 (1)、(2) 和 (3) 的 结 点 中 下 标 j 最 小 。 

从 图 10-2 的 合并 算法 得 到 相应 的 最 小 相 容 合并 树 ,如 图 10-3 所 示 。 
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图 10-2 最 小 相 容 合并 算法 图 10-3 最 小 相 容 合并 树 


图 10-3 中 原始 结 点 上 方 的 数字 表示 相应 的 原始 结 点 在 相 容 合并 树 中 所 处 的 层 序 。 虽 
然 最 小 相 容 合并 算法 不 满足 货物 储 运 问题 的 相 邻 性 约束 ,但 对 货物 储 运 问题 做 更 深入 的 分 


析 后 可 得 到 其 重要 的 算法 特征 如 下 。 
定理 (相同 层 序 定 理 ) 存在 货物 储 运 问题 的 最 优 合并 树 ,其 各 原始 结 点 在 最 优 合并 树 


中 所 处 的 层 序 与 相应 的 原始 结 点 在 相 容 合并 树 中 所 处 的 层 序 相同 。 
根据 上 述 定理 ,容易 从 图 10-3 中 各 原始 结 点 在 相 容 合并 树 中 所 处 的 层 序 构造 出 相应 的 


最 优 合并 树 ,如 图 10-4 所 示 。 
10.3.3 算法 三 部 曲 


1. 组 合 阶段 

将 给 定 的 个 数 作为 方形 结 点 依 序 从 左 到 右 排 列 : a[1],a[L2],…,aLnj]。 

反复 删除 序列 中 最 小 相 容 结 点 对 a[i] 和 a[jj, 且 i<j, 并 在 位 置 i 处 插入 值 为 
a[ 让 十 a[j] 的 圆 形 结 点 ,直至 序列 中 只 剩 下 1 个 结 点 。 
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4+7+6+7+12+13+25=74 
图 10-4 最 优 合并 树 


2. 标记 层 序 阶 段 

将 第 一 阶段 结束 后 留 下 的 唯一 结 点 标记 为 第 0 层 结 点 。 然 后 以 与 第 一 阶段 相反 的 组 合 
顺序 标记 其 余 结 点 的 层 序 。 

例如 , 结 点 a[ 站 十 a[ 门 标记 为 第 层 结 点 , 则 结 点 a[ 门 和 a[ 门 均 标 记 为 第 & 十 1 层 
结 点 。 
3. 重组 阶段 
根据 标记 层 序 阶段 计算 出 的 各 结 点 的 层 序 , 按 下 述 规 则 重组 。 
结 点 a[ 让 和 a[ 站 重组 为 新 结 点 应 满足 以 下 条 件 : 
(1) a[ 门 和 a[ 站 在 当前 序列 中 相 邻 。 
(2) a[ 让 和 a[ 站 均 为 当前 序列 中 最 大 层 序 结 点 。 
(3) 在 所 有 满足 条 件 (1) 和 (2) 的 结 点 中 ,下 标 i 最小。 


10.3.4 算法 实现 


1. 数据 结构 一 一 可 并 优先 队列 
2 相继 方形 结 点 及 其 间 圆 形 结 点 存储 于 可 并 优先 队列 hpq(j) 中 ;各 可 并 优先 队列 
hpq(j) 中 最 小 元 min(j) 存 处 于 优先 队列 mpq 中 ,如 图 10-5 所 示 。 


hpq(1) hpq(2) 四 hpq() 


轴 © ONO © ©- © 


mpq 


图 10-5 可 并 优先 队列 


2. 组 合算 法 
算法 三 部 曲 的 关键 是 如 下 组 合 阶段 : 
(1) 从 优先 队列 mpq 中 依次 取出 最 小 元 mn。 
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(2) 将 与 mn 相应 的 最 小 相 容 结 点 对 合并 。 二 
(3) 对 合并 最 小 相 容 结 点 对 后 的 最 小 相 容 森林 ,可 并 优先 队列 hpq(j) 以 及 优先 队列 于 


mpq 进行 相应 修改 。 具 体 算法 combination 表述 如 下 : 


private static void combination() 
{ 
InitO; 
for (int k=1; k<n; k 十 十 ) 
{ 
mn 一 mpq. removeMin(); 
modifyHpqCmn. hpq); 
merge(mn. i, mn.j); 
modifyMpq(mn. hpq); 


modifyTree(mn. i, mn.j); 


} 


合并 可 并 优先 队列 hpq(7) 中 的 最 小 相 容 结 点 对 min(1) 和 min(2) 后 ,应 将 其 从 hpq(j) 
中 删 去 ,并 将 合并 生成 的 圆 形 结 点 插入 hpq( 站 中 ,如 图 10-6 所 示 。 


modifyHpq(mn.hpq) 


Ea 


delete 


min(1)+min(2) 


图 10-6 ”修改 可 并 优先 队列 


Private static void modifyQ(int key,int index) 
{ 
hNode newhp=new hNode(key,index); 
tt[left]. hp. put(newhp) ; 
mNode newmp= min2(left) ; 
HbltNode mpqn 一 mpq. putAndReturnNode(newmp); 
tt[left]. mp 一 mpqny; 


} 


待 合并 的 最 小 相 容 结 点 对 中 的 方形 结 点 从 所 在 的 两 个 可 并 优先 队列 hpq(j) 和 hpq(j 十 
1) 中 删 去 后 ,这 两 个 可 并 优先 队列 合并 为 一 个 新 的 可 并 优先 队列 ,如 图 10-7 所 示 。 


Private static void merge(int il ,int i2) 


if ((il>left) && (il<right)) tt[Lleft]. hp. removeMin(); 
if ((i2>left) &&(i2<right)) tt[left]. hp. removeMin(); 


if (11== left) 
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merge(mn.imn.)) 


-OO 者 OO 
0. C=O 


O 
O 


O 


OU 


(a) 


CO -OO 和 NO -O 〇 和 OO 
0O-0@0-0O oO-O 


(b) 
10-7 可 并 优先 队列 的 合并 


int ileft= tt[left]. prev; 

HbltNode mpqn= tt[ileft]. mp; 

if (mpqn!=null) mpq. removeElementInNode(mpqn); 
tt[ileft]. hp. meld(tt[left]. hp); 

tt[left]. hp= null; 

left= ileft; 

tt[left]. next= right; 

tt[right]. prev= left; 


if (i2==right) 
{ 
int iright= tt[right]. next; 
HbltNode mpqn=tt[right]. mp; 
if (mpqn! 王 null) mpq. removeElementInNode(mpqn); 
tt[left]. hp. meld(tt[right]. hp) ; 
tt[right]. hp 一 null; 
right= iright; 
tt[right]. prev= left; 
tt[left]. next= right; 


} 


两 个 可 并 优先 队列 hpq(j) 和 hpq(j 十 1) 合 并 后 ,应 将 其 最 小 元 从 优先 队列 mpq 中 删 
去 ,并 将 新 生成 的 可 并 优先 队列 的 最 小 元 插入 优先 队列 mpq, 如 图 10-8 所 示 。 

具体 算法 在 min2 中 实现 。 

Private static mNode min2(int index) 


{ 
MinHbltWithRemoveNode hpq= ttLindex]. hp; 
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modifyMpq(mn.hpq) 10 


1 delete 


图 10-8 修改 优先 队列 


int right= tt[index]. next; 
hNode [] m=new hNode[ 4]; 
m[0]=new hNode(tt[index]. key,index); 
m[1]=new hNode(tt[right]. key, right) ; 
m[2]= (hNode) hpq. getMin(); 
m[3]= (hNode) hpq. getMin2(); 
hNode hn=new hNode(Integer. MAX_VALUE,index); 
if (m[2]==null) m[2]=hn; 
让 (m[3]==null) m[3]=hn; 
Sort(m); 
if ((m[0J!=nulD &&(m[1]!=nulD)) 
{ 

int i=m[0]. index, 

j=m[1]. index; 
i (>)) 
{ 
int temp=i; 


i=j; 


j=temp; 
} 
mNode mn 一 new mNode(m[0]. key+m[1]. key,index,i,j); 
return mn; 
} 
else return null; 


} 


合并 最 小 相 容 结 点 对 min(1) 和 min(2) 后 ,在 当前 最 小 相 容 森 林 中 ,新 生成 的 圆 形 结 点 
成 为 min(1) 和 min(2) 的 父 结 点 ,如 图 10-9 所 示 。 
Private static void modifyTree(int il ,int i2) 


人 
aNode newap 一 new aNode(0,tt[il]. ap, tt[i2]. ap); 
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modifyTree (mn.i,mn./) 


0 


图 10-9 修改 最 小 相 容 森 林 


tt[il]. ap= newap; 
tt[i2]. ap= null; 
} 


3. 标记 层 序 算法 
组 合 阶段 完成 后 ,得 到 最 小 相 容 树 。 从 最 小 相 容 树 的 根 结 点 出 发 ,递归 地 标记 各 结 点 的 
层 序 如 下 : 


private static void assign() 
{ 

assign(tt[1]. ap,0); 
} 


private static void assign(aNode node, int lev) 
{ 

if (node. index>0) level[node. index]= lev; 

if (node. left!= null) assign(node. left, lev+1); 

if (node. right!=null) assign(node. right, lev+1); 
} 


4. 重组 算法 

根据 标记 层 序 阶段 计算 出 的 各 结 点 的 层 序 , 按 相 邻 性 规则 重组 。 

结 点 a[ 让 和 a[ 站 重组 为 新 结 点 应 满足 以 下 条 件 : Stack Queue 

(1) a[ 杂 和 a[ 站 在 当前 序列 中 相 邻 。 3 @ FE 

(2) a[ 让 和 a[ 站 均 为 当前 序列 中 最 大 层 序 结 点 。 EJ 7 

(3) 在 所 有 满足 条 件 (1) 和 (2) 的 结 点 中 ,下 标 i 最小。 下 一 @ [全 12 

具体 实现 时 用 一 个 栈 ; 和 一 个 队列 g 以 及 一 个 中 间 单 ”四 证 | @ [下 
元 p 来 完成 。 开 始 时 ,将 最 左 结 点 放 入 中 间 单 元 p 中 ,其 [ED 人 四 4 
余 结 点 依 序 放 入 队列 g 中 。 将 p 中 结 点 反复 与 ; 的 栈 顶 结 @ 和 
点 或 g 的 队 首 结 点 比较 , 层 序 相同 者 合并 ,p 中 结 点 层 序 减 @E 


1; 和 否则 , 中 结 点 进 栈 ,dg 队 首 结 点 进入 pp。 上述 过 程 进行 
到 p 中 结 点 层 序 为 0, 如 图 10-10 所 示 。 


I 
| 


private static int recombination (int n) 
{ 


int bridge,k=1,sum=0; 


图 10-10 重组 最 优 合并 树 


LinkedStack s = new LinkedStack(); 
LinkedQueue q = new LinkedQueue(); 
让 (n==1) return tt[1]. key; 
if (n==2) return tt[1]. key 十 tt[L2]. key; 
bridge=1; 
for (int i=2;i<=n;i++) 

q. put(new Integer(i) ); 


while (k=n) 
{ 
s. push(new Integer(bridge)); 
bridge= ((Integer)q. remove()). intValue(); 
while (sames(s, bridge) | | sameq(q, bridge)) 
{ 
while (sames(s, bridge)) 
{ 
int si= ((Integer)s. pop()). intValue(); 
tt[bridge]. key+=tt[si]. key; 
sum 十 一 tt[bridge]. key; 
k 十 十 ; 
level[Lbridge] 一 一 ; 
} 
if (sameq(q,bridge)) 
{ 
int qi 一 ((Integer)q. remove()). intValue(); 
tt[bridge]. key 十 一 tt[qi]. key; 
sum 十 一 tt[Lbridge]. key; 
k 十 十 
level[Lbridge] 一 一 ; 


} 


return sum; 


10.3.5 算法 复杂 性 
改进 的 算法 由 组 合 .标记 层 序 和 重组 3 个 阶段 构成 。 


Public static int compute() //O(n logn) 
{ 
input(); 
combination(); //O(n logn) 
assign(); //O(n) 
return recombination(); //O(n) 
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算法 的 主要 计算 量 在 组 合 阶段 。 用 左 偏 树 实现 可 并 优先 队列 ,可 在 O(logn) 时 间 内 完 
成 可 并 优先 队列 的 各 运算 。 因 此 ,组 合 阶段 算法 combination 所 需 的 计算 时 间 为 O(nlogn)。 
标记 层 序 算法 assign 和 重组 阶段 算法 recombination 显然 只 需要 O(n) 时 间 。 因 此 ,新 算法 
所 需 的 总 计算 时 间 为 O(nlogn)。 


10.4 优化 数据 结构 


本 节 讨论 的 带 权 区 间 最 短路 问题 容易 变换 为 一 般 图 的 最 短路 问题 。 因 此 ,用 关于 一 般 
图 最 短路 问题 的 Dijkstra 算法 ,可 以 在 OG ) 时 间 内 解 直线 上 个 带 权 区 间 的 最 短路 问题 。 
通过 对 问题 的 分 析 并 选用 合适 的 数据 结构 ,可 将 算法 的 计算 时 间 减 至 O(na(n))。 本 节 以 此 
实例 展示 数据 结构 在 算法 设计 中 的 地 位 和 作用 。 数 据 结构 的 优化 直接 导致 算法 的 优化 。 


10.4.1 带 权 区 间 最 短路 问题 


S 是 直线 上 n 个 带 权 区 间 的 集合 。 从 区 间 TIE S 到 区 间 ES 的 一 条 路 是 S 的 一 个 区 
间 序 列 (1),J(2),…,J(k)。 其 中 ,J 本 (1)==1,J(k)= 二 J, 且 对 所 有 1 二 i 二 k 一 1, (i) 与 
J (i 十 1) 相 交 。 这 条 路 的 长 度 定义 为 路 上 各 区 间 权 之 和 。 在 所 有 从 了 到 J 的 路 中 ,路 长 最 短 
的 路 称 为 从 了 到 J 的 最 短路 。 带 权 区 间 图 的 单 源 最 短路 问题 要 求 计算 从 S 中 一 个 特定 的 
源 区 间 到 S 中 所 有 其 他 区 间 之 间 的 最 短路 。 

一 个 区 间 工 包含 另 一 个 区 间 J 当 且 仅 当 IInJ =J。 区 间 工 交 区 间 J 当 且 仅 当 
INJAS。 

设 集合 S 由 区 间 了 (1) ,1(2),…,1(n) 构 成 。 

I(i) = [a(i),6(0i)], 1<i<n,b(1)<6(2) So(n),. 区 间 I(i) 带 权 
w(i)>0,1<i<n。 

由 区 间 101) ,1(2),…,1( 让 构成 的 集合 记 为 SGD) ,1<i<n。 

不 失 一 般 性 , 设 区 间 1(1) ,1(2),…,I(n) 的 并 覆 六 了 从 a(1) 到 b(n) 的 线段 。 源 区 间 是 
FLY 

对 于 任 一 区 间 集 S, 其 并 集 可 能 有 多 个 连通 分 量 。 若 区 间 I 和 J 分 别 属于 S 的 并 集 的 
两 个 不 同 的 连通 分 量 , 则 区 间 I 和 J 在 S 中 没有 路 。 


10.4.2 算法 设计 思想 


区 间 集 S(i) 的 扩展 定义 为 : S(i) UT, 其 中 工 是 满足 下 面条 件 的 另 一 区 间 集 。TT 中 任 
意 区 间 1==[a,6] 均 有 46>6(i)。 

设 区 间 I(k) (Rk 二 四 是 区 间 集 S( 让 中 的 一 个 区 间 ,1 志 i 二 n。 如 果 对 于 SCO) 的 任意 扩展 
S(DUT, 当 区 间 JET 且 在 S(OD)UT 中 有 从 10Q) 到 J 的 路 时 ,在 SCDUT 中 从 1(1) 到 J 的 
任 一 最 短路 都 不 含 区 间 ICE) , 则 称 区 间 ITC) 是 SG) 中 的 无 效 区 间 。 若 SGD) 中 的 区 间 TCR) 
不 是 无 效 区 间 则 称 其 为 SG) 中 的 有 效 区 间 。 

在 图 10-11 中 ,区 间 1(2) 是 S(4) 中 的 无 效 区 间 ; 区 间 1(3) 是 S(4) 中 的 有 效 区 间 ; 区 间 
1(5) 是 S(5) 中 的 无 效 区 间 ; 区 间 1(9) 是 S(10) 中 的 无 效 区 间 ; 区 间 1(10) 是 S(10) 中 的 有 效 
区 间 。 


草 法 优化 笑 略 


第 
w(4)=8 w(6)=11 w(8)=5 10 
w(5)=8 章 
wlF7 ww2)3 w(7)=13 w(9)=6 
w(3)=5 w(10)=9 
图 10-11 区 间 集 


性 质 1: 区 间 IC) 是 S( 让 ) 中 的 有 效 区 间 , 则 对 任意 ji, 区间 1(8) 是 SG) 中 的 有 效 
区 间 。 另 一 方面 ,车 区 间 IC) 是 S() 中 的 无 效 区 间 , 则 对 任意 j>i, 区 间 1(8) 是 SG(j) 中 的 无 
效 区 间 。 

性 质 2: 集合 SGD) 中 所 有 有 效 区 间 的 并 覆盖 从 ec(1) 到 507) 的 线段 ,其 中 0) 是 SG) 的 
最 右 有 效 区 间 的 右 端点 。 

事实 上 ,对 SG) 中 任 一 有 效 区 间 I(k), k 志 i, 由 定义 可 知 ,在 S(i) 中 有 一 条 从 1(1) 到 
I(k) 的 最 短路 。 这 意味 着 这 条 最 短路 上 所 有 区 间 均 为 S(i) 中 有 效 区 间 。 由 此 可 见 , 若 45(j) 
是 S() 的 最 右 有 效 区 间 的 右 端 点 , 则 集合 S(i) 中 所 有 有 效 区 间 的 并 覆 羔 从 a(1) 到 464()) 的 
线段 。 

性 质 3: 区 间 1(?) 是 集合 S( 让 中 的 有 效 区 间 当 且 仅 当 在 SGz) 中 有 一 条 从 ITC1) 到 TCD) 
的 路 。 

SG 中 从 TIG1) 到 TGD) 的 最 短路 长 记 为 distGi ,7 门 ,ij)。 当 这 六 时 ,distGi, 门 一 十 co。 

由 上 面 的 定义 可 知 ,对 所 有 i 均 有 ,dist(i,1) 宇 dist(i,2) 宇 … 宇 dist(i,n)。 

若 在 SC 让 中 不 存在 从 1(1) 到 (4) 的 路 , 则 对 kj 和 i 有 dist(j ,让 = 十 2。 

在 图 10-11 中 ,dist(8,9) 一 十 co ,dist(8,10) 二 29。 

性 质 4: 当 这 >& 且 distG.iD 一 dist(R .iD 时 ,TIG) 是 SGD) 中 的 无 效 区 间 。 

由 distGii<dist(,i 知 ,distGi 过 十 co。 从 而 在 S( 让 中 有 一 条 从 IT(1) 到 I( 让 的 路 
和 一 条 从 I(1) 到 I(k) 的 路 。 由 dist(i, 站 二 dist(k, 丫 可 推 知 ,SO 让 中 从 10) 到 了 (i) 的 最 短路 
中 不 含 区 间 I(k)。 由 此 可 见 ,I(k) 是 S(i) 中 的 无 效 区 间 。 

性 质 5: 设 1G)),I1(j(2)),…,1(j(k)) 是 S(i) 中 的 有 效 区 间 ( 图 10-12), 且 
j(D)<i2) < RSi, NM distG (DDSdist 2) ,DSSdistO (Rk) ,7 ), 


(A 
102) 


0D 
图 10-12 有 效 区 间 的 单调 性 


性 质 6: 如 果 区 间 1( 让 包含 区 间 I(k) (因此 i>k), 且 dist(i, 让 过 dist(k, 丫 , 则 I(k) 是 
SQ 中 的 无 效 区 间 。 

性 质 7: 当 i>k 且 dist(i, 让 过 dist(k,i 一 1) 时 ,1(k) 是 SG 让) 中 的 无 效 区 间 。 

事实 上 ,由 dist(i, 让 过 dist(k,i 一 1) 知 ,dist(i, 站 过 十 吕 。 从 而 在 S(i) 中 有 一 条 从 1(1) 
到 I( 让 的 路 和 一 条 从 I(1) 到 TCD) 的 路 。 下 面 分 两 种 情况 讨论 。 
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(1) SQ 中 从 71(1) 到 I(k) 的 最 短路 中 不 含 区 间 1(i)。 此 时 ,dist(k,2) 二 dist(k,i 一 1)， 


因此 dist(i, 站 二 dist(k,i)。 由 性 质 6 即 知 1(8) 是 S(i) 中 的 无 效 区 间 。 


(2) SQ 中 从 I(1) 到 I(8) 的 最 短路 中 含 区 间 1(i)。 因 此 ,dist(k, 让 写 dist(i, 让 十 
vw(k) 记 dist(i, 让 (由 于 w(k) 记 0), 又 由 性 质 6 知 1(k) 是 SG) 中 的 无 效 区 间 。 
性 质 8: 如 果 区 间 I(k)(k 放 1) 不 包含 S(k 一 1) 中 任 一 有 效 区 间 TO 的 右 端点 507) , 则 对 


任意 i 三 k&,1(k) 是 S(i) 中 的 无 效 区 间 。 


假设 I(k) 是 SG) 中 的 有 效 区 间 。 由 性 质 2 知 ,S(k) 中 所 有 有 效 区 间 的 并 覆盖 从 a(1) 
到 6b(k) 的 线段 。 因 此 ,区 间 TCR) 包 含 了 SG) 中 不 同 于 IC(k) 的 男 一 有 效 区 间 1()) 的 右 端 点 
0(7)) Ck)。 由 于 I)ES(k 一 1) 二 SCk) 一 {1(k)), 由 假设 即 知 ,1(j) 是 S(k 一 1) 中 的 无 效 
区 间 , 从 而 1()) 也 是 SC) 中 的 无 效 区 间 。 此 为 矛盾 。 因 此 ,TCD) 是 SC(k) 中 的 无 效 区 间 。 


根据 上 面 的 讨论 可 设计 带 权 区 间 图 的 最 短路 算法 如 下 : 


算法 shortestIntervalPaths 
{ 
步骤 1: dist(1,1)< 一 w(1)， 
步骤 2: 
for (i=2;i<=n;it+) 
{ 
(2.1): 
j=min{ k | a()<b(k);1<k<i }; 
让 G 不 存在 ) dist(i,D 一 十 co; 
else dist(i,D)<—dist(j ,i—1)+w(D); 
(2.2): 
for (k<i) 
{ 
if (dist(i,D<dist(k,i—1)) dist(k,D)<+o0; 
else dist(k,D)<—dist(k,i—1); 


} 
步骤 3: 
for (〈i 一 2;i< 一 nj;i 十 十 ) 
和 
让 (dist(iyn) 一 十 co) { 
j=min{ k | (dist(k,n) 一 十 cc)&& CaGD<b(k)) }; 
dist(i'n) 一 dist(jyn) 十 w(D; 


} 

上 述 算法 的 关键 是 有 效 地 实现 步骤 2 中 的 (2.1) 和 (2. 2)。 
10.4.3 算法 实现 方案 

1. 实现 方案 1 


用 一 棵 平衡 搜索 树 (2-3 树 ) 存 储 当 前 区 间 集 S( 让 中 的 有 效 区 间 。 


为 序 , 如 图 10-13 所 示 。 


以 区 间 的 右 端点 的 值 
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于 | Se 于 | | 

21) 1(/02)) JU-D) 10(0D) 
HDI) … ik-D) IR) 

10-13 ”存储 有 效 区 间 的 平衡 搜索 树 


算法 shortestIntervalPaths 步骤 2 中 的 (2. 1) 的 实现 对 应 于 平衡 搜索 树 从 根 到 叶 的 一 
条 路 径 上 的 搜索 ,在 最 坏 情况 下 需要 O(logn) 时 间 。 

算法 shortestIntervalPaths 步骤 2 中 的 (2. 2) 的 实现 对 应 于 反复 检查 并 删除 平衡 搜索 
树 中 最 右 叶 结 点 的 前 驱 结 点 。 在 最 坏 情况 下 ,每 删除 一 个 结 点 需要 O(logn) 时 间 。 

综 上 所 述 ,算法 shortestIntervalPaths 用 平衡 搜索 树 的 实现 方案 ,在 最 坏 情况 下 的 计算 
时 间 复 杂 性 为 O(nlogn) 。 

2. 实现 方案 2 

采用 并 查 集结 构 。 用 整数 上 表示 区 间 I(k) ,1 三 kn。 初始 时 每 个 元 素 k 构成 一 个 单 
元 素 集 , 即 集合 上 是 {&} ,1<k<n。 

(1) 每 个 当前 有 效 区 间 I(k) 在 集合 中 。 设 Gi(1)),1(i(2)),…,I(i(k)) 是 S( 让 中 的 
有 效 区 间 , 且 i(1) 过 i(2) 二 …<<i(k)。 对 任意 1 二 j 二 一 1, 集 合 {h1i(j) 二 hi(j 十 1)} 包 含 
在 集合 i(j 十 1) 中 。 依 此 定义 ,集合 i(j 十 1) 中 包含 介 于 有 效 区 间 1(i(j)) 和 I(Gi(j 十 1)) 之 间 
的 所 有 无 效 区 间 和 有 效 区 间 I(1G 十 1)) 的 区 间 序 号 。 

(2) 对 每 个 集合 SGD) , 设 

L(S( 站 ) 二 {1(k)11(k) 是 S(i) 的 无 效 区 间 , 且 1(8) 与 S(i) 的 任 一 有 效 区 间 均 不 相交 } 

例如 ,在 图 10-11 中 ,S(9) 的 有 效 区 间 是 1(1),1(3),1(4);L(S(9))=={1(5),1(6)， 
C7) TC8),TC9)Y, 

由 性 质 2 可 知 ,L(S(i)) 中 所 有 区 间 均 位 于 SGD) 的 所 有 有 效 区 间 并 的 右 侧 。 工 (SG) ) 非 
空当 且 仅 当 1G)EL(S(2))。 当 LL(SQ)) 非 空 时 ,L(S(i)) 中 所 有 无 效 区 间 的 序号 存放 在 集 
合 i 中 。 

(3) 用 一 个 栈 AS 存放 当前 有 效 区 间 了 (i(1)),1(i(2)),…,I(i(k))。I(i(k)) 是 栈 顶 元 
。 该 栈 称 为 当前 有 效 区 间 栈 。 

(4) 对 于 1 过 入 2, 记 prev(I1(k))=min{j|a(k)<6()}。 

例如 ,在 图 10-11 中 ,prev(TI(5)) 王 5,prev(TI(9)) 一 8,prevCTI(10)) 一 4。 

prev(CT(GR))<R; 仅 当 区 间 ICE) 不 含 其 他 区 间 的 右 端点 时 prevCI(CR) ) 一人。 

由 于 prev(I(k)) 的 定义 是 静态 的 ,可 以 对 给 定 的 区 间 序 列 做 一 次 线性 扫描 确定 
prev(I(k) ) 的 值 。 

(5) 对 于 当前 区 间 集 S(2) ,用 一 维 数组 dist 记录 dist(j ,让 的 值 。 


没 
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(6) 用 dist[k] 二 一 1 标记 区 间 1(k) 为 无 效 区 间 ，。 
基于 上 述 并 查 集结 构 ,基本 算法 中 的 步骤 2 可 实现 如 下 : 


算法 shortestIntervalPaths 
{ 
步骤 1: 
int [] dist=new int [nj]; 
UnionFind uf=newUnionFind(n); 


int[] succ=new int [nj]; 


for (int i=1;i<n;it+) 
{ 
succ[i]=i; 
for (int j 王 0;j 一 ij 十 十 ) 
if (a[ 订 < 一 bj]) 
{ 
succ[i]=j; 


break; 


for (int i=1;i<n;i+t+) System. out. println(succ[i]); 
LinkedStack as 一 new LinkedStack(); 


dist[0] 一 w[0]; 
as. push(new Integer(0)); 


步骤 2: 
for (int ij 一 1;i<nj;i 十 十 ) 
4 
int j= uf. find(succ[i]); 


//(2.D): 

if (G==D)1|G==i—1)&8&(dist[i—1]<0)) 
{ 

dist[i]=—1; 


if (dist[i—1]<0) uf. union(i—1,D); 
} 
//(2.2): 

if (GD) & 8dist[j]>0)) 

《 
dist[i]= dist[j]+ w[i]; 
if (dist[i—1]<0) uf. union(i—1,D); 
// 对 栈 AS 进行 如 下 调整 : 
while (!as. empty()) 
{ 


int k 一 ((Jnteger) as. peek()). intValue(); 


if (dist[i]<distLk]) 
{ 
as. pop(); 
distLk] 一 一 1; 
uf. union(k,iD; 
} 
else break; 
as. push(new Integer(D)); 
} 
} 
// 步 又 3: 
for (int i=1;i<n;it+) 
{ 
succ[i]=0; 
for (int j=0;j<n;j++) 
if ((dist[j]>0)&&(a[i]<=b[j])) 
| 
succ[i]=j; 
break; 
} 
} 
for (int i=1;i<n;it+) 
if (dist[i]<0) dist[i]= dist[succ[i]]+ w[i]; 


long sum=0; 


System. out. println(”dist[i]”) ; 
for (int i=0; i<n; i 十 十 ) 
{ 

sum 二 二 dist[i]; 

System. out. println(dist[i]); 
} 


System. out. println( sum) ; 


并 法 优化 策略 


容易 看 到 ,上 述 算法 总 共 执 行 O(n) 次 union 和 find 运算 。 由 此 可 见 , 在 最 坏 情况 下 , 算 
法 需要 O(na(n)) 计 算 时 间 , 其 中 ,a(n) 是 单 变 量 Ackerman 函数 的 道 函 数 ,对 于 通常 所 见 到 
的 na(n) 三 4。 


10.4.4 


并 查 集 


在 一 些 应 用 问题 中 , 需 将 个 不 同 的 元 素 划分 成 一 组 不 相交 的 集合 。 开 始 时 ,每 个 元 素 
自 成 一 个 单元 素 集 合 , 然 后 按 一 定 顺 序 将 属于 同一 组 元 素 的 集合 合并 。 其 间 要 反复 用 到 查 


询 某 个 元 素 


属于 哪个 集合 的 运算 。 适 合 于 描述 这 类 问题 的 抽象 数据 类 型 称 为 并 查 集 。 它 的 
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数学 模型 是 一 组 不 相交 的 动态 集合 的 集合 S 二 {A ,B,C,…}, 它 支持 以 下 运算 。 
(1) union(A,B): 将 集合 A 和 B 合并 ,其 结果 取 名 为 A 或 B。 
(2) find(z): 找 出 包含 元 素 zx 的 集合 ,并 返回 该 集合 的 名 字 。 
在 并 查 集中 需要 两 种 类 型 的 参数 : 集合 名 字 的 类 型 和 元 素 的 类 型 。 在 许多 情况 下 ,可 
以 用 整数 作为 集合 的 名 字 。 如 果 集 合 中 共有 个 元 素 , 可 以 用 范围 [1: nj 以 内 的 整数 表示 
元 素 。 实 现 并 查 集 的 一 个 简单 方法 是 使 用 数组 表示 元 素 及 其 所 属 子 集 的 关系 。 其 中 ,用 数 
组 下 标 表示 元 素 ,用 数组 单元 记录 该 元 素 所 属 的 子 集 名 字 。 如 果 元 素 类 型 不 是 整 型 , 则 可 以 
先 构 造 一 个 映射 ,将 每 个 元 素 映 射 成 子 一 个 整数 。 这 种 映射 可 以 用 散 列表 或 其 他 方式 实现 。 
采用 树 结构 实现 并 查 集 的 基本 思想 是 ,每 个 集合 用 一 棵 树 表 示 。 树 的 结 点 用 于 存储 集 
合 中 的 元 素 名 。 每 个 树 结 点 还 存放 一 个 指向 其 父 结 点 的 指针 。 树 根 结 点 处 的 元 素 代 表 该 树 
所 表示 的 集合 。 利 用 映射 可 以 找到 集合 中 元 素 所 对 应 的 树 结 点 。 
父亲 数组 是 实现 上 述 树 结构 的 有 效 方法 。 
public class UnionFind 
{ 
private static class Node 
{ 
int parent; 
boolean root; 
private Node() 
{ 
parent=1; 
root= true; 
} 


} 
Node [] node; 


public UnionFind(int n) 
{ 
node=new Node [n+1]; 
for (int e=0; e<—n; e 十 十 ) node[e]=new Node(); 
} 
} 


其 中 ,Node 是 表示 树 结构 的 父亲 数组 。 构 造 方法 将 每 个 元 素 初始 化 为 一 棵 单 结 点 树 。 
在 并 查 集 的 父亲 数组 表示 下 ,find(e) 运 算 就 是 从 元 素 e 相应 的 结 点 走 到 树 根 处 , 找 出 所 
在 集合 的 名 字 。 
public int find(int e) 
{ 
while (! node[e]. root) e=node[e]. parent; 


return e; 


} 
合并 2 个 集合 ,只 要 将 表示 其 中 一 个 集合 的 树 的 树 根 改 为 表示 另 一 个 集合 的 树 的 树 根 


算法 优化 笑 略 


第 

的 儿子 结 点 。 
10 
public void union(int A, int B) 章 


{ 
node[ A]. parent 十 一 nodeLB]. parent; 
nodeLB]. root 一 false; 
node[ B]. parent= A; 

} 


容易 看 出 ,在 最 坏 情 况 下 ,合并 可 能 使 个 结 点 的 树 退 化 成 一 条 链 。 在 这 种 情况 下 对 所 
有 元 素 各 执行 一 次 find 将 耗 时 O(z2)。 所 以 ,尽管 union 只 需要 O(1) 时 间 , 但 find 可 能 使 
总 的 时 间 耗 费 很 大 。 为 了 克服 这 个 缺点 ,可 以 做 下 述 改 进 ,使 得 每 次 find 不 超过 O(logn) 时 
间 。 在 树 根 中 保存 该 树 的 结 点 数 ,每 次 合并 时 总 是 将 小 树 合并 到 大 树 上 去 。 当 一 个 结 点 从 
一 棵 树 移 到 另 一 棵 树 上 去 时 ,这 个 结 点 到 树 根 的 距离 就 增加 1, 而 这 个 结 点 所 在 的 树 的 大 小 
至 少 增加 一 倍 。 于 是 并 查 集中 每 个 结 点 至 多 被 移动 O(logn) 次 ,从 而 每 个 结 点 到 树 根 的 距 
离 不 会 超过 O(logn)。 所 以 ,每 次 find 运算 只 需 O(logn) 时 间 。 

改进 后 的 union 运算 将 小 树 合并 到 大 树 上 去 。 

public void union(int i, int j) 

{ 

if (node[i]. parent<node[j]. parent) 

{ 
node[j]. parent+= node[i]. parent; 
node[i]. root= false; 
node[i]. parent 一 j; 

} 


else 


{ 
node[i]. parent 十 一 node[j]. parent; 


node[j]. root 王 false; 


node[j]. parent=i; 


} 


加 速 并 查 集运 算 的 另 一 个 办 法 是 采用 路 径 压缩 技术 。 在 执行 find 时 ,实际 上 找到 了 从 
一 个 结 点 到 树 根 的 一 条 路 径 。 路 径 压缩 就 是 把 这 条 路 上 的 所 有 结 点 都 提升 1 层 。 


public int find(int e) 

{ 
int current=e, p, gp; 
if (node[current]. root) return current; 
p=node[current]. parent; 
让 (node[Lp]. root) return p; 
gp 一 node[p]. parent; 
while(true) 


{ 
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node[ current]. parent 一 gp; 

if (node[gpj. root) return gp; 
current=p; 

P 一 gp; 

gp 一 node[p]. parent; 


} 


路 径 压 缩 并 不 影响 union 运算 的 时 间 , 它 仍然 只 要 O(1) 时 间 。 但 是 路 径 压缩 大 大 地 加 
速 了 find 运算 。 如 果 在 执行 union 时 总 是 将 小 树 并 到 大 树 上 ,而 且 在 执行 find 时 ,实行 路 
径 压 缩 , 则 可 以 证 明 ,n 次 find 至 多 需要 O(na(n)) 时 间 。 


10.4.5 可 并 优先 队列 


可 并 优先 队列 是 一 个 以 集合 为 基础 的 抽象 数据 类 型 。 除 了 必须 支持 优先 队列 的 插入 和 
删除 最 小 元 运算 外 ,可 并 优先 队列 还 支持 两 个 不 同 优先 队列 的 合并 运算 。 

用 堆 实 现 优先 队列 ,可 在 O(logn) 时 间 内 支持 同一 优先 队列 中 的 基本 运算 。 但 合并 两 
个 不 同 优先 队列 的 效率 不 高 。 下 面 讨论 的 左 偏 树 结构 不 但 能 在 O(logn) 时 间 内 支持 同一 优 
先 队 列 中 的 基本 运算 ,而 且 还 能 有 效 地 支持 两 个 不 同 优先 队列 的 合并 运算 。 

左 偏 树 是 一 类 特殊 的 优先 级 树 。 常 用 的 左 偏 树 有 左 偏 高 树 和 左 偏重 树 两 种 不 同类 型 。 
顾名思义 , 左 偏 高 树 的 左 子 树 偏 高 ,而 左 偏重 树 的 左 子 树 偏重 。 下 面 给 出 其 严格 定义 。 

若 将 二 又 树 结 点 中 的 空 指针 看 作 是 指向 一 个 空 结 点 , 则 称 这 类 空 结 点 为 二 又 树 的 前 端 
结 点 ,并 规定 所 有 前 端 结 点 的 高 度 ( 重 量 ) 为 0。 

对 于 二 又 树 中 任意 一 个 结 点 zx, 递归 地 定义 其 高 度 s(z) 为 

s(X) 一 min {s(L),s(R)}+1 

其 中 ,L 和 R 分 别 是 结 点 的 左 儿 子 结 点 和 右 儿 子 结 点 。 

一 棵 优先 级 树 是 一 棵 左 偏 高 树 , 当 且 仅 当 在 该 树 的 每 个 内 结 点 处 ,其 左 儿 子 结 点 的 高 (s 
值 ) 大 于 或 等 于 其 右 儿 子 结 点 的 高 (s 值 ) 。 

对 于 二 又 树 中 任意 一 个 结 点 zx, 其 重量 w(z) 递 归 地 定义 为 

wz) = w(L) 二 +w(R)+1 

其 中 ,L 和 R 分 别 是 结 点 z 的 左 儿 子 结 点 和 右 儿 子 结 点 。 

一 棵 优先 级 树 是 一 棵 左 偏重 树 , 当 且 仅 当 在 该 树 的 每 个 内 结 点 处 ,其 左 儿子 结 点 的 重 
(w 值 ) 大 于 或 等 于 其 右 儿子 结 点 的 重 (w 值 )。 

左 偏 高 树 具 有 下 面 性 质 : 

设 工 是 一 棵 左 偏 高 树 的 任意 一 个 内 结 点 , 则 

(1) 以 z 为 根 的 子 树 中 至 少 有 2” 一 1 个 结 点 。 

(2) 如 果 以 z 为 根 的 子 树 中 有 zz 个 结 点 , 则 s(z) 的 值 不 超过 log(m 十 1)。 

(3) 从 工 出 发 的 最 右 路 经 的 长 度 恰 为 s(x)。 

证 明 : (1) 设 结 点 z 位 于 树 的 第 & 层 。 由 s(x) 的 定义 知 ,以 z 为 根 的 子 树 在 第 十 j 层 
的 每 个 结 点 恰 有 2 个 儿子 结 点 ,0 三 j 二 s(x) 一 1。 因 此 ,以 xz 为 根 的 子 树 在 第 十 j 层 恰 有 


zx(D-1 


2 个 结 点 ,0 二) s(Cz) 一 1。 从 而 ,以 z 为 根 的 子 树 中 至 少 有 》) 21 = 2 一 1 个 结 点 。 
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(2) 由 (1 可 立即 推出 。 
(3) 由 sx) 的 定义 ,以 及 在 左 仿 高 树 中 每 个 内 结 点 处 ,其 左 儿子 结 点 的 信 大 于 或 等 于 间 
其 右 儿子 结 点 的 s 值 , 即 可 推出 。 


左 偏 树 类 型 MinHblt 如 下 : 


public class MinHblt 
{ 
// 左 偏 树 结 点 类 型 
static class HbltNode 
{ 
Comparable element; 
int s; //s 值 
HbltNode leftChild; // 左 儿子 结 点 指针 
HbltNode rightChild; 。 // 右 儿子 结 点 指针 
// 构 造 方法 


private HbltNode(Comparable theElement, int theS) 
{ 


element= theElement; 
s=theS; 


HbltNode root; // 根 结 点 指针 
int size; // 树 中 元 素 个 数 


public boolean isEmpty() 


{return size 一 一 0;} 


public int size() 


{return size;} 


左 偏 树 结 点 中 element 存放 优先 队列 中 的 元 素 ;s 保存 当前 结 点 的 * 值 ;leftChild 和 
rightChild 分 别 是 指向 左 、 右 儿子 结 点 的 指针 。 
在 左 偏 树 中 最 关键 的 运算 是 左 偏 树 的 合并 运算 meldCz,y)。 它 将 2 棵 分 别 以 x 和 y 为 
根 的 左 偏 树 合并 为 1 棵 新 的 以 z 为 根 的 左 偏 树 。 
public void meld( MinHblt x) 
{ 
root= meld(root, x. root); 


size+=x. sizes 


private static HbltNode meld( HbltNode x, HbltNode y) 
{ 

if (y null) return x; //y 是 1 棵 空 树 

if (x== null) return y; //x 是 1 棵 空 树 
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//x 和 y 均 非 空 
if (x. element. compareTo(y. element) >0) 
{ 
HbltNode t=x; 
X 一 了 3 
了 本 村 
//x. element<— y. element 
x. rightChild= meld(x. rightChild, y); 
这 (x. leftChild 二 二 null) //x 的 左 子 树 为 空 树 
{// 交 换 其 左 、 右 子 树 
x. leftChild= x. rightChild ; 
x. rightChild= null’; 
Sl 
} 
else 
{ // 车 x 的 右 子 树 高 则 交换 其 左 、 右 子 树 
if (x. leftChild. s=x. rightChild. s) 
{ 
HbltNode t= x. leftChild; 
x. leftChild= x. rightChild; 
x. rightChild= t; 
} 
x. s 一 x. rightChild. s 十 1; 
} 


return x; 


} 


上 述 算法 的 基本 思想 是 沿 左 偏 高 树 x 的 右 链 ,递归 地 进行 子 树 合并 。 将 左 偏 树 > 与 x 
的 右 子 树 合并 后 , 若 z 的 右 子 树 高 则 交换 其 左 、 右 子 树 ,以 维持 树 的 左 偏 高 性 质 。 
由 左 偏 高 树 的 性 质 (3) 可 知 , 及 个 元 素 的 左 偏 高 树 的 右 链 长 为 O(logn)。 合 并 算法 在 
右 链 的 每 个 结 点 处 耗费 O(1) 时 间 , 因 此 算法 meld 所 需 的 计算 时 间 为 O(logn)。 
要 在 左 偏 高 树 中 插入 一 个 元 素 xz, 可 先 创建 存储 元 素 z 的 单 结 点 左 偏 高 树 ,然后 将 新 创 
建 的 单 结 点 左 偏 高 树 与 待 插入 的 左 偏 高 树 合并 即 可 。 
public void put(Comparable theElement) 
{ 
HbltNode q=new HbltNode (theElement, 1); 
root= meld(root, q); 
size 十 十; 
} 


由 于 算法 meld 的 计算 时 间 为 O(logn) ,所 以 ,算法 put(z) 所 需 的 计算 时 间 为 O(logn)。 
getMin 运算 只 要 返回 根 结 点 中 元 素 即 可 。 
removeMin 运算 删除 根 结 点 后 ,将 根 结 点 的 左 、 右 子 树 合并 。 
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public Comparable getMin() 各 
10 
if (size 一 一 0) return null; 章 


else return root. element; 


public Comparable removeMin() 
{ 
if (size==0) return null; 
Comparable x= root. element; 
root= meld(root. leftChild, root. rightChild) ; 
Size—— 3 
return x; 


} 


removeMin 所 需 的 计算 时 间 显 然 也 是 O(logn)。 

左 偏 高 树 的 初始 化 运算 用 给 定数 组 中 的 n 个 元 素 创建 1 棵 存储 这 个 元 素 的 左 偏 高 
树 。 如 果 用 逐次 将 元 素 插 入 左 偏 高 树 的 方法 , 则 需 O(nlogn) 时 间 。 下 面 的 初始 化 方法 只 需 
On) 时 间 。 


public void initialize(Comparable [] theElements, int theSize) 
{ 

size= theSize; 

ArrayQueue q=new ArrayQueue( size); 

// 队 列 初始 化 

for (int i=1; i<= size; i 十 十 ) 

// 创 建 单 结 点 树 
q. put(new HbltNode(theElements[i], 1)); 

// 依 队列 顺序 合并 左 偏 高 树 

for (int i=1; i<= size—1; i 十 十 ) 

{ // 从 队列 中 删除 2 棵 左 高 树 并 合并 之 
HbltNode b= (HbltNode) q. remove(); 
HbltNode c= (HbltNode) q. remove(); 
b=meld(b, ¢); 

// 合 并 后 的 新 左 高 树 入 队 
q. put(b); 
} 
if (size>0) root = (HbltNode) q. remove(); 
} 


上 述 算法 先 创建 存储 所 给 n 个 元 素 的 n 棵 单 结 点 左 偏 高 树 , 并 将 这 棵 树 存 人 一 个 队 
列 Q 中 。 然 后 依 队列 顺序 逐次 合并 队 首 的 2 棵 左 高 树 , 直 至 队列 Q 中 只 剩 下 1 棵 树 时 
为 止 。 

上 述 算法 合并 了 z/2 棵 单 结 点 树 ,z/4 棵 2 结 点 树 ,n/8 棵 4 结 点 树 …… 合 并 2 棵 2 结 
点 的 左 偏 高 树 需 要 OG 十 1) 时 间 。 因 此 ,上 述 初 始 化 算法 所 需 的 计算 时 间 为 
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O(Cz/2 十 2(z/4) 十 3(02/8) 十 …) 一 o> 二 )= O(n) 


10.5 优化 搜索 策略 


迄今 为 止 ,还 没有 解 NP 完全 问题 的 多 项 式 时 间 算 法 。 然 而 在 实际 应 用 中 遇 到 的 许多 
问题 是 NP 完全 问题 ,解决 这 类 问题 的 基本 方法 是 对 问题 的 解 空间 的 搜索 。 常 用 的 有 回 淹 
法 、 分 支 限界 等 。 提 高 这 类 算法 效率 的 常用 方法 是 优化 其 搜索 策略 。 本 节 以 最 短 加 法 链 问 
题 为 例 , 讨 论 常见 的 算法 优化 搜索 策略 。 

1. 最 短 加 法 链 问题 

首先 考虑 最 优 求 寡 问题 如 下 : 给 定 一 个 正 整 数 n 和 一 个 实数 zx, 如何 用 最 少 的 乘法 次 
数 计算 出 xz"。 例 如 ,可 以 用 6 次 乘法 逐步 计算 zx” 如 下 : Zz, ,T,X ,T,X ,x”。 可 以 证 
明 计 算 z” 最 少 需 要 6 次 乘法 。 计 算 zs 的 寡 序 列 中 各 寡 次 1,2,3,5,10,20,23 组 成 了 一 个 
关于 整数 23 的 加 法 链 。 在 一 般 情况 下 ,计算 xz" 的 宪 序 列 中 各 笑 次 组 成 正 整数 的 一 个 加 
法 链 

=a <a<a<<a=n 
ai=a+tar,s kj<i, i=1,2,.,r 

上 述 最 优 求 突 问 题 相应 于 正 整 数 的 最 短 加 法 链 问题 , 即 求 n 的 一 个 加 法 链 使 其 长 度 
r 达到 最 小 。 正 整数 的 最 短 加 法 链 长 度 记 为 1 (0)。 

2. 回溯 法 

构造 最 短 加 法 链 的 最 直观 的 算法 是 回溯 法 。 此 时 ,问题 的 状态 空间 树 如 图 10-14 所 示 。 
其 中 ,第 i 层 结 点 a; 的 n 子 结 点 aiwi 之 a; 由 aj 十 ar ,kj 二 i 所 构成 。 
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图 10-14 最 短 加 法 链 问 题 的 状态 空间 树 


对 最 短 加 法 链 问 题 的 状态 空间 树 进行 深度 优先 搜索 的 回溯 法 可 描述 如 下 : 


private static void backtrack(int step) 
{// 解 最 短 加 法 链 问 题 的 标准 回溯 法 
int i,j,k; 
让 (a[step]== 二 n) ”// 找 到 一 条 加 法 链 
{ 
if (step<best) 
{ 
best= step; 
for (int r=1;r<= best;r 二 十 ) 
chain[r] 一 a[r]; 
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} 
return; 
} 
// 对 当前 结 点 aLstep] 的 每 一 个 儿子 结 点 递归 搜索 
for (i 王 stepji 之 一 15i 一 一 ) 
if (2* a[i]>aLstep]) 
for G0=i;j>=1;j——) 
{ 
k 一 a[ 训 十 a[j]; 
a[Lstep 十 ]] 一 k; 
if ((k>a[step)&&(k<—=n)) backtrack(Cstep 十 1); 
} 
} 


由 于 加 法 链 问 题 的 状态 空间 树 的 每 一 个 第 & 层 结 点 至 少 有 A& 十 1 个 儿子 结 点 ,所 以 从 根 
结 点 到 第 & 层 的 任 一 结 点 的 路 径 数 至 少 是 上 &!。 因 此 ,状态 空间 树 是 以 指数 方式 增长 的 。 用 
标准 的 回溯 法 只 能 对 较 小 的 构造 出 最 短 加 法 链 。 

3. 述 代 搜索 法 

用 回溯 法 搜索 加 法 链 问题 的 状态 空间 树 时 ,由 于 采用 了 深度 优先 的 搜索 方法 ,算法 所 搜 
索 到 的 第 一 个 加 法 链 不 一 定 是 最 短 加 法 链 。 如 果 利 用 广度 优先 的 方式 搜索 加 法 链 问题 的 状 
态 空 间 树 , 则 算法 找到 的 第 一 个 加 法 链 就 是 最 短 加 法 链 , 但 这 种 方法 的 空间 开销 太 大 。 逐 步 
深化 的 迭代 搜索 算法 既 能 保证 算法 找到 的 第 一 个 加 法 链 就 是 最 短 加 法 链 , 又 不 需要 太 大 的 
空间 开销 。 其 基本 思想 是 控制 回溯 法 的 搜索 深度 d, 从 d 二 1 开始 搜索 ,每 次 搜索 后 使 4 增 
1, 加 深 搜索 深度 ,直到 找到 一 条 加 法 链 为 止 。 

private static void backtrack(int step) 

{// 最 短 加 法 链 问题 的 控制 回溯 搜索 深度 回溯 法 

int ij,k; 
if (1found){ 
if (aLstep]==n) 
// 找 到 一 条 加 法 链 
best= step; 
for (int r=1;r<= best;r 二 十 ) 
chain[r] 一 a[r]; 

found= true; 


return; 
. 
else if (step 二 lb) ”// 控 制 回溯 搜索 深度 
// 对 当前 结 点 aLstep] 的 每 一 个 儿子 结 点 递归 搜索 
for (i=step;i>=1;i——) 
if (2 * a[i]>a[step]) 
for (=i;j>=1;j——) 
{ 
k 一 a[ 训 十 aDj]; 
a[step+1]=k; 
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if ((k>a[step) &&(k<—=n)) backtrack(Cstep 十 1); 
} 


} 


private static void iterativeDeepening() 
{// 逐 步 深化 的 迭代 搜索 算法 
best=n 二 1; 
found= false; 
lb 二 2; ”// 初 始 迭 代 搜 索 深 度 
while (! found) 
{ 
a[1]=1; 
backtrack(1); 
lb 十 十 ; // 加 深 搜索 深度 
} 
} 


4. 最 短 加 法 链 长 的 下 界 

对 于 正 整 数 , 记 4(n) 二 Llogn ,vn)==n 的 二 进 制 表 示 中 1 的 个 数 。 迄 今 为 止 所 知道 
的 1) 的 最 好 下 界 是 1(n) 三 16(n) 二 XA(n) 十 [logv(n)1。 利 用 这 个 下 界 ,在 使 用 逐步 深化 的 迭 
代 搜 索 算 法 时 ,可 以 从 深度 为 d= 二 6(n) 开 始 搜索 ,大 大 加 快 了 算法 的 搜索 进程 。 

5. 蚊 枝 函数 

设 a; 和 a; 是 加 法 链 中 的 两 个 元 素 , 且 w 二 2"oj 。 由 于 加 倍 是 加 法 链 中 元 素 增 大 的 最 快 
的 方式 , 即 a; 志 2ai-1,1 志 ir, 所 以 从 aj 到 a; 至 少 需要 六 十 1 步 。 如 果 预 期 在 状态 空间 树 
工 的 第 gd 层 找 到 关于 ? 的 一 条 加 法 链 , 则 以 状态 空间 树 第 i 层 结 点 a; 为 根 的 子 树 中 ,可 在 
第 d 层 找到 一 条 加 法 链 的 必要 条 件 是 24 ai 二 2。 由 此 可 知 , 当 24 ai 一 7 时 ,不 可 能 在 以 a; 
为 根 的 子 树 中 第 d 层 找到 加 法 链 , 因 此 可 以 将 以 ai 为 根 的 子 树 剪 去 。 

当 是 奇数 时 ,这 个 前 枝条 件 还 可 以 加 强 。 事 实 上 , 当 是 奇数 时 ,可 以 断言 其 最 短 加 
法 链 的 最 后 一 个 元 素 a, 二 aj 十 ai ,kj ,是 奇数 。 由 此 可 推 知 & 达 j ,否则 a, 为 偶数 。 由 7 最 
小 又 可 推 知 j 二 7 一 1。 因 此 a, 二 a 十 a4，k<r 一 1。 因 此 ,如 果 在 第 d 层 找到 最 短 加 法 链 ， 
即 ”一 d, 则 asi 十 as-: 宇 n。 又 由 于 asi 二 24as-2， 故 3ag-z 宇 n, 从 而 由 2as-s 宇 as-: 知 此 时 
6as-s 之 n。 一般 地 ,对 于 i 二 0,1,…,d 一 2 有 3X24 +?4; 之 n。 换 句 话 说 , 当 3X2< ?a 过 
n 时 ,状态 空间 树 中 以 结 点 ai 为 根 的 子 树 中 不 可 能 在 第 d 层 之 前 找到 最 短 加 法 链 。 因 此 ， 
可 将 以 结 点 ai 为 根 的 子 树 剪 去 。 

设 在 求 正 整数 盖 的 最 短 加 法 链 的 逐步 深化 迭代 搜索 算法 中 ,当前 搜索 深度 为 4, 则 在 状 


态 空间 树 的 第 ; 层 结 点 a; 处 的 一 个 剪 枝条 件 是 
log(zV/3ai) 十 zi 十 2 二 d 人 02 
log(n/ai)+i>d d—1l1<id 


易 知 , 当 n 是 2 的 究 , 即 nn 二 2” 时 ,唯一 的 最 短 加 法 链 是 1,2,4,8,…,2"。 当 不 是 2 
的 竹 时 ,可 将 n 表示 为 n 二 2'(2k 十 1) ,k 三 1。 上述 结论 还 可 推广 到 更 一 般 的 情形 。 
设 在 求 正 整数 的 最 短 加 法 链 的 逐步 深化 迭代 搜索 算法 中 ,当前 搜索 深度 为 4。 且 正 
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整数 可 表示 为 n 二 2'(2k 十 1) ,k 宇 1, 则 在 状态 空间 树 的 第 i 层 结 点 a; 处 的 一 个 剪 枝条 件 是 ; 
log(n/3a)+i+2>d 0<i<d—i—2 
ee d—t—1<i<d 和 
这 个 结论 可 以 证 明 如 下 。 
(1) 设 0<i<d 一 :一 2 且 log(n/3a;) 十 i 十 2 之 d, 即 3X2 人 ?a,<n, 由 于 i<d 一 1 一 2 且 
1 三 1, 则 id 一 3。 因 此 要 在 以 结 点 a; 为 根 的 子 树 中 第 d 层 找到 加 法 链 至 少 还 要 3 步 。 考 


虑 om 三 中 十 as 入 j 天 2 且 mx 之 i 十 1。 如 果 a 不 是 一 个 加 倍 结 点 , 即 a 了 关 2a。-1;, 则 二 j。 
由 此 可 知 ,j 志 mm 一 1,s 志 j 一 1 志 m 一 2。 从 而 有 
Qn amil 二 amz 
Ce 
= 2""27i(24; 十 ai) 
一 22 一 (3ai) 
在 以 a, 为 根 的 子 树 中 第 d 层 找到 最 短 加 法 链 的 必要 条 件 是 2 "av 过 2z。 由 此 可 得 
NA 2 a OB) Bn/ 2 = 
此 为 矛盾 。 
如 果 对 于 mm 之 i 十 1,aw 均 为 加 倍 结 点 , 且 在 w 为 根 的 子 树 中 第 d 层 找 到 最 短 加 法 链 , 则 
有 ?= 一 au 一 24 Dai+l。 这 说 明 2 他 2 可 以 整除 2。 又 由 于 id 一 1 一 2, 可 知 d 一 i 一 1 之 t 十 
1。 由 此 推 得 ,2'(2k 十 1) mod 2 一 0, 即 2k 十 1 可 以 被 2 整除 。 此 为 矛盾 。 
因此 , 当 0 受过 d 一 :一 2 上 且 log(n/3a;) 十 i 二 2d 时 ,可 以 将 以 w 为 根 的 子 树 前 去 。 
(2) 当 d 一 t 一 1<i<d 时 ,与 前 面 论述 的 理由 相同 。 
6. 最 短 加 法 链 长 的 上 界 
最 短 加 法 链 长 度 的 一 个 上 界 是 1(x) 志 4(n) 十 v(n) 一 1。 关 于 最 短 加 法 链 的 著名 不 等 式 
1(2" 一 1) 志 n 一 1 十 1(n) 至 今 还 是 一 个 猜想 。 
事实 上 与 加 法 链 问 题 密切 相关 的 竹 树 给 出 了 71(n) 的 更 精确 的 上 界 ,如 图 10-15 所 示 。 


10-15 竹 树 


假设 已 定义 了 等 树 工 的 第 k 层 结 点 , 则 T 的 第 & 十 1 层 结 点 可 定义 如 下 。 依 从 左 到 右 
顺序 取 第 上 层 结 点 ex .定义 其 按 从 左 到 右 顺 序 排列 的 儿子 结 点 为 a 十 a; ,0 三 j 三 &。 其 中 ， 
ad 是 从 工 的 根 到 结 点 ax 的 路 径 , 且 a 十 aj 在 工 中 未 出 现 过 。 

含 正 整 数 n 的 部 分 短 树 T 容易 在 线性 时 间 内 构造 如 下 : 


private static void find(int step) 


{// 递 归 构 造 竹 树 
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int i,k; 
if (lfound) 
if (a[step]==n) 
{ // 找 到 一 条 加 法 链 
best= step; 
for (int r 一 1;r< 一 best;r 十 十 ) 
chain[r]=a[Lr]; 
found= true; 
return; 
} 
else if (step< 一 ub) // 递 归 深 度 为 ub 
// 对 当前 结 点 aLstep] 的 每 一 个 儿子 结 点 递归 搜索 
for (ij 王 1;i< 一 step;ii 十 十 ) 
{ 
k=a[step]++a[i]; 
让 (k< 一 5) 
{ 
a[step 十 ]] 一 kj; 
if (parent[k]==0) parent[k]=a[step]; 
if (parent[k]==a[step]) find(step+1); 
} 


private static int powerTree() 
{// 以 逐步 深化 的 迭代 搜索 方式 构造 窗 树 
int 1; 
parent = new intLmaxn]; 
found= false; 
ub 二 1; // 初 始 迭 代 搜 索 深度 
while (! found) 
{ 
a[1] 一 1; 
find(1); 
ub 十 十 ; // 加 深 搜索 深度 
} 
return best; 


} 
从 根 结 点 1 到 结 点 n 的 路 径 就 是 一 条 关于 正 整 数 n 的 加 法 链 。 该 加 法 链 的 长 度 , 即 结 
点 对 在 树 T 中 的 深度 就 是 2(z) 的 一 个 很 好 的 上 界 。 
7. 优化 算法 
综合 前 面 的 讨论 ,对 构造 最 短 加 法 链 的 标准 回溯 法 进行 如 下 改进 : 
(1) 采用 逐步 深化 迭代 搜索 策略 。 
(2) 利用 710) 的 下 界 26(z) 对 和 迭代 深度 做 精确 估计 。 


算法 优化 笑 略 


(3) 采用 剪 枝 函 数 对 问题 的 状态 空间 树 进行 剪 枝 搜 索 ,加 速 搜索 进程 。 和 
(4) 用 寡 树 构造 1(n) 的 精确 上 界 wb(n)。 章 


当 16(n) 二 wb(n) 时 , 徊 树 给 出 的 加 法 链 已 是 最 短 加 法 链 。 
当 6(n) 二 wb(n) 时 ,用 改进 后 的 逐步 深化 迭代 搜索 算法 ,从 深度 d= 二 16(n) 开 始 搜 索 。 
改进 后 的 逐步 深化 迭代 搜索 算法 描述 如 下 : 


private static void backtrack(int step) 
{// 最 短 加 法 链 问 题 控 制 回 溯 搜 索 深度 的 剪 枝 回溯 法 
int i,j,k; 
if (lfound) 
if (a[step]==n) 
{// 找 到 一 条 加 法 链 
best= step; 
for (int r 一 1;r< 一 bestir 十 十 ) 
chain[r]=a[r]; 
found= true; 
return; 
} 
else if (step 过 lb) // 控 制 回溯 搜索 深度 
// 对 当前 结 点 aLstep] 的 每 一 个 儿子 结 点 递归 搜索 
for (i=step;i>=1;i——) 
if (2 * a[i]>a[step]) 
for (j=i;j>=1;j——) 
{ 
k=a[i]+a[j]; 
a[step+1]=k; 
if ((k>a[step) &&(k<—=n)) 
// 剪 枝 回溯 ,pruned 为 剪 枝 函 数 
if (1 pruned(step 十 1)) backtrack(Cstep 十 1); 


private static void search() 


{// 逐 步 深 化 的 迭代 剪 枝 回溯 算法 
lb 一 lowerB(n)， //lb 一 XCn) 十 [logvCn) 为 1(n) 的 下 界 
ub= powerTree(); //ub 是 用 短 树 构造 的 1(n) 的 上 界 
System. out. println("ub 一 "十 ub); 
t=gett(n); //n=2'(2k+1),k>1 
if (lb<ub){ //lb 是 初始 迭代 搜索 深度 


found= false; 

while (| found) 

{ 
System. out. println( "lb 一 "十 lb); 
a[1]=1; 
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backtrack(1); 
lb++; // 加 深 搜索 深度 
if (lb==ub) found= true; 
} 
} 


小 结 


本 章 通过 实例 介绍 算法 设计 中 常用 的 算法 优化 策略 。 

最 大 子 段 和 问题 是 阐述 正确 选择 算法 设计 策略 的 重要 性 的 典型 范例 。 最 大 子 段 和 问题 
的 简单 算法 需要 OC) 计算 时 间 。 用 分 治 策略 可 将 计算 时 间 减 至 O(nlogn)。 通 过 深入 分 
析 , 采 用 动态 规划 算法 将 计算 时 间 进 一 步 减 至 O(n) ,从 而 得 到 解 该 问题 的 最 优 算法 。 

满足 四 边 形 不 等 式 性 质 的 问题 是 用 动态 规划 算法 有 效 求解 的 常见 问题 。 本 章 以 货物 储 
运 问题 为 例 ,讨论 动态 规划 加 速 原理 。 利 用 四 边 形 不 等 式 性 质 ,将 计算 时 间 从 OG ) 降 至 
On) 

考查 问题 的 特殊 性 质 有 助 于 设计 有 效 算法 。 本 章 通 过 实例 分 析 , 展 示 利 用 问题 的 算法 
特征 ,优化 算法 计算 时 间 和 空间 的 一 般 策 略 。 对 货物 储 运 问 题 深入 分 析 ,挖掘 问题 的 算法 特 
征 ,设计 出 有 效 的 算法 ,将 计算 时 间 从 OC) 降 至 O(nlogn) ,成 为 一 个 最 优 算法 。 

本 童 还 以 带 权 区 间 最 短路 问题 为 例 ,讨论 了 数据 结构 的 优化 对 算法 效率 的 影响 。 

对 于 回溯 法 ,分 支 限 界 法 等 搜索 算法 ,其 搜索 策略 极 大 地 影响 着 算法 效率 。 以 最 短 加 法 
链 问 题 为 例 ,本 章 讨论 了 常见 的 算法 优化 搜索 策略 。 


习 题 


10-1 证 明 第 3 章 中 解 最 优 二 又 搜 索 树 问 题 的 O(n ) 时 间 算 法 obst 的 正确 性 。 

10-2 试 设 计 解 矩阵 连 乘 问题 的 O(n ) 时 间 
算法 。 5 3| |4 加 2| |3| |4 

10-3 ”货物 储 运 问题 中 , 当 合并 e[ 问 和 e[ 门 所 需 让 
费用 不 是 a[ 门 十 a[ 让 ,而 是 别 的 简单 函数 ， 站 
如 a[ 记 Xa[ 门 或 la[ 让 一 a[ 门 | 时 ,如 何 设 5 1 天 于 1 
计 有 效 算法 ? 

10-4 设计 实现 货物 储 运 问题 的 另 一 个 稍 不 同 的 
最 优 算法 如 图 10-16 所 示 。 该 算法 与 本 章 Ls [BB 
第 3 节 所 述 算法 的 区 别 在 于 组 合 阶 段 的 策 1 [ol 攻 | 应 
略 稍 有 不 同 。 标 记 层 序 阶段 和 重组 阶段 完 
全 相同 。 试 设计 实现 上 述 思 想 的 O(nlogn) 
时 间 算 法 。 25 

图 10-16 货物 储 运 问题 的 最 优 算法 


15| |10 


第 章 
—11 在 线 算法 设计 


前 面 各 章 讨论 的 算法 设计 策略 都 是 基于 在 执行 算法 前 输入 数据 已 知 的 基本 假设 。 也 
就 是 说 ,算法 在 求解 问题 时 已 具有 与 该 问题 相关 的 完全 信息 。 通 常 将 这 类 具有 问题 完全 
信息 前 提 下 设计 出 的 算法 称 为 离线 算法 (off line algorithms) 。 对 于 实际 问题 来 说 ,情况 往 
往 不 同 。 许 多 问题 以 在 线 (on line) 的 方式 给 出 算法 所 需 的 数据 。 算 法 在 执行 前 对 这 些 数 
据 一 无 所 知 。 例 如 ,在 磁盘 存储 调度 问题 中 ,用 户 对 磁盘 的 访问 请 求 是 无 法 预知 的 , 它 是 
随 着 时 间 的 推移 一 个 接着 一 个 地 给 出 的 。 对 于 这 类 在 线 问 题 设 计 的 算法 就 称 为 在 线 算 
法 。 由 于 不 具备 完全 信息 ,在线 算法 找到 的 解 只 是 局 部 最 优 解 而 无 法 保证 整体 最 优 。 因 
此 ,从 这 个 意义 上 说 ,所 有 在 线 算法 都 是 近似 算法 。 本 章 通 过 实例 讨论 在 线 算法 设计 的 
基本 方法 。 


11.1 在 线 算法 设计 的 基本 概念 


在 线 算法 设计 问题 中 的 一 个 经 典 问题 是 & 服务 问题 。 给 定 一 个 有 个 顶点 的 图 G ,其 
个 顶点 均 为 服务 对 象 ,随时 会 提出 服务 要 求 。 现 有 上 辆 服务 车 按 提出 服务 要 求 的 先后 次 序 
来 往 服 务 于 n 个 顶点 之 间 。 假 设 辆 车 的 初始 位 置 是 确定 的 ,服务 要 求 是 在 服务 过 程 中 一 
个 接着 一 个 地 给 出 的 。 也 就 是 说 ,每 一 时 刻 只 知道 在 此 之 前 的 服务 要 求 序列 。 问 如 何 调度 
和 辆 服务 车 比较 节省 , 即 & 辆 车 在 服务 过 程 中 移动 的 总 距离 较 短 。 
容易 想到 下 面 的 采用 就 近 服 务 贪心 策略 的 在 线 算法 。 
public static void kserver(int j) 
{ 
int i = mindistG); 
movel(i, j); 


} 


并 由 move(i, 门 派 车 i 前 往 项 点 j 服务 。 
考查 当 & 王 2 时 服务 问题 的 一 个 简单 实例 如 下 。 
设 图 G 是 有 3 个 顶点 的 一 条 路 ,如 图 11-1 所 示 。 其 中 ,项 i 2 
点 A 到 顶点 B 的 边 长 为 1, 顶 点 B 到 顶点 C 的 边 长 为 2。 初 娘 co @ 2 


A B 已 
时 2 :分 别 顶点 B 和 顶点 C 处。 
上 时 2 辆 服务 车 分 别 停 在 顶 和 项 处 站 让 民 亲 问题 的 顽 拉 
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如 果 提 出 服务 要 求 的 m 个 顶点 的 序列 为 ABAB…AB, 用 上 述 贪心 算法 将 使 初始 时 停 
在 顶点 B 处 的 服务 车 在 顶点 A 和 B 之 间 移 动 m 次 。 因 此 ,移动 的 总 距离 为 m。 而 对 于 此 
服务 需求 序列 , 当 mm 二 2 时 ,最 优 调度 方案 应 当 是 ,首先 将 项 点 B 处 的 服务 车 移动 到 A 处 ， 
然后 将 另 一 辆 车 从 顶点 C 移动 到 顶点 了 ,这样 就 可 以 一 劳 永 逸 了 ,而 移动 的 总 距离 仅 为 3。 
可 见 采 用 贪心 算法 得 到 的 移动 距离 与 最 优 值 的 比 可 达到 mx/3。 这 个 比值 随 mr 可 增 大 至 
无 穷 。 

上 述 贪心 策略 不 合理 的 原因 是 它 可 能 使 一 辆 车 很 忙 ,而 另 一 辆 车 很 闲 。 一 种 比较 公平 
的 办 法 是 让 每 辆 车 移动 的 距离 相差 不 多 。 如 果 第 i 辆 车 已 移动 的 距离 为 d[ 庄 , 当 顶点 7 提 
出 服务 要 求 时 选择 第 1 辆 车 使 d[J+ dist(,)) = min {d[i]+ dist(i,)))} ,将 第 1 辆 车 派 往 顶 
点 7 ,其 中 dist(i,7) 是 当前 状态 下 第 i 辆 车 到 顶点 7 的 距离 。 按 此 算法 修改 mindist(7) 
如 下 : 


public static int mindist(int j) 
{ 
int s = d[1] + dist(1, ); 
int min=1; 
for (int i = 2; i < 一 ki i++) 
{ 
int tmp = d[i] + dist(i, j); 
if (tmp = s) {s= tmp; min = i;} 
} 
d[min] = s; 
return min; 


} 


对 图 11-1 的 实例 采用 改进 后 的 算法 得 到 的 移动 距离 不 超过 5。 事实 上 可 以 证 明 , 对 任 
何 服务 需求 序列 ,上 述 算法 的 移动 距离 不 超过 最 优 值 的 2 倍 。 

在 一 般 情 况 下 ,在 线 算 法 A 要 回答 一 系列 的 在 线 请 求 c=c(C1),c(2),…,a(Cmz)。 当 算法 
A 回答 请 求 o(i) 时 并 不 知道 后 续 请 求 0)) ,j 记 i 的 任何 信息 。 算 法 回答 每 个 请 求 都 需 一 定 
的 耗费 。 在 线 算 法 的 设计 目标 是 使 回答 所 有 请 求 的 耗费 尽 可 能 小 。 

在 线 算 法 设计 问题 中 的 另 一 个 容易 理解 的 问题 是 设备 租赁 问题 。 假 设 有 一 个 企业 根据 
市 场 需求 生产 商品 A。 该 企业 可 以 花费 工 元 购买 生产 该 商品 的 设备 ,也 可 以 每 天 花费 1 元 
租用 生产 该 商品 的 设备 。 商 品 A 的 市 场 需求 期 是 有 限 的 。 如 果 能 预先 知道 商品 A 的 市 场 
需求 期 工 , 则 显然 当 工 <T 时 选择 租用 设备 ,而 当 区 三 人 工时 购买 设备 。 但 在 通常 情况 下 很 难 
预先 知道 商品 A 的 市 场 需求 期 ,因此 ,需要 一 个 在 线 算法 确定 租赁 设备 的 策略 。 选 取 一 个 
整数 &, 在 前 & 天 租用 设备 ,而 在 第 & 十 1 天 购买 设备 。 如 何 评价 这 个 在 线 算法 ? 通常 将 在 
线 算法 与 最 优 离线 算法 进行 比较 。 这 种 比较 方法 称 为 竞争 分 析 (competitive analysis) 。 

设 在 线 算法 A 的 输入 序列 为 c, 算 法 A 的 耗费 为 Ca(o) ,最 优 离线 算法 OPT 的 耗费 为 
Copr(o) 。 如 果 存 在 非 负 常数 a 和 ec ,使 C4(o) 三 aCopr (o) 十 c 对 任何 输入 序列 o 都 成 立 , 则 称 
算法 A 是 a 竞争 的 (a-competitive) ,常数 a 称 为 算法 A 的 竞争 比 。 当 在 线 算法 A 的 竞争 比 
a 不 可 能 再 改进 时 , 称 在 线 算法 A 为 最 优 在 线 算法 。 

按 此 定义 考查 上 述 设 备 租 赁 问题 的 在 线 算法 。 当 二 0 时 ,在 第 1 天 就 购买 设备 ,此 
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时 在 线 算法 是 全 竞争 的 ,在 L=1 时 达到 最 坏 情况 。 当 二 了 一 1 时 ,在 前 T 一 1 天 租用 设 
备 ,而 在 第 了 天 购买 设备 。 如 果 工 二 本, 则 在 线 算法 的 耗费 与 最 优 离线 算法 的 耗费 相同 。 
如 果 工 二 了 , 则 在 线 算 法 的 耗费 为 2T 一 1, 而 最 优 离线 算法 的 耗费 为 了。 此 时 在 线 算 法 是 
(2 一 1/T) 竞 争 的 。 容 易 证 明 , 对 于 设备 租赁 问题 ,(2 一 1/T) 竞 争 的 在 线 算法 是 最 优 在 线 
算法 。 


11.2 页 调度 问题 


页 调度 问题 是 系统 软件 设计 中 提出 的 一 个 基本 问题 。 系 统 软件 在 进行 内 存 管 理 时 ， 
将 内 存 按 其 存 取 速度 分 成 2 级 , 即 高 速 缓存 和 低速 内 存 。 内 存 被 分 成 固定 大 小 的 页 面 进 
行 管理 。 高 速 缓存 可 容纳 & 个 页 面 ,其 他 页 面 在 低速 内 存 中 。 页 调度 问题 的 输入 是 内 存 
访问 请 求 序列 oo(1),o(2),…,o(m)。 当 内 存 访问 请 求 要 访问 的 页 面 oC 让 在 高 速 缓存 
中 时 , 则 不 需 页 面 调度 ;而 当 页 面 cCi) 不 在 高 速 缓存 中 时 ,发生 页 面 缺 失 , 调 度 算 法 要 确 
定 高 速 缓存 中 与 o(i) 交 换 的 页 面 。 页 调度 算法 对 于 内 存 访 问 请 求 序列 co 一 c(1),c(2),，…， 
olm) 的 耗费 是 算法 在 执行 过 程 中 产生 的 页 面 缺失 次 数 。 在 线 页 调度 算法 回答 内 存 访问 
请 求 (iD 时 ,并 不 知道 后 续 内 存 访问 请 求 a(j) ,j 之 i 的 任何 信息 。 下 面 讨 论 几 种 常见 的 在 
线 页 调度 策略 。 

(1) LIFO(last in first out) 算 法 : 内 存 访问 请 求 o( 让 发 生 页 面 缺失 时 ,将 最 近 调 入 高 速 
缓存 的 页 面 与 cCz) 交 换 。 

(2) FIFO(first in first out) 算 法 : 内 存 访 问 请 求 c(?z) 发 生 页 面 缺失 时 ,将 最 早 调和 人 高 速 
缓存 的 页 面 与 o(i) 交 换 。 

(3) LRU(least recently used) 算 法 : 内 存 访问 请 求 o( 让 发 生 页 面 缺 失 时 ,将 高 速 缓存 
中 最 近 访 问 时 间 最 早 的 页 面 与 c(i 让 交换 。 

(4) LFU(least frequently used) 算 法 : 内 存 访问 请 求 c(?) 发 生 页 面 缺 失 时 ,将 高 速 缓存 
中 访问 次 数 最 少 的 页 面 与 o( 让 交换 。 

首先 ,考查 在 线 算法 LIFO 和 LFU。 

设 o=p,q,p,q，…, 其 中 pp 和 g 是 内 存 中 2 个 不 同 的 页 面 。 对 于 内 存 访问 请 求 序 列 o， 
算法 LIFO 的 耗费 为 jc| ,而 最 优 离线 算法 的 耗费 为 2。 由 此 可 见 , 对 任何 非 负 常数 w, 在 线 
算法 LIFO 都 不 是 a 竞争 的 。 类 似 分 析 可 知 ,对 任何 非 负 常 数 a, 在 线 算法 LFU 也 都 不 是 a 
竞争 的 。 

其 次 ,考查 在 线 算法 LRU 和 FIFO。 

设 高 速 缓存 可 容纳 个 页 面 。 对 于 内 存 访问 请 求 序列 c, 在 线 算法 LRU 的 耗费 为 
Crru (0) ,最 优 离线 算法 OPT 的 耗费 为 Copr (c) 。 

通过 下 面 的 分 析 可 以 证 明 在 线 算 法 LRU 的 竞争 比 为 上 。 

要 证 明 这 个 结论 的 正确 性 就 是 要 证 明 对 于 任何 内 存 访问 请 求 序 列 c=c(C1),c(2),…， 
ol(m) 有 Crru(o) 寺 RCopr (ao) 。 

不 失 一 般 性 可 设 在 初始 状态 下 算法 LRU 与 算法 OPT 有 相同 的 高 速 缓存 。 根 据 算法 
LRU 的 输出 结果 可 以 将 内 存 访问 请 求 序列 c 一 cC1) ,ol(2),… ,olm) 划 分 为 若干 阶段 PC0)， 
P(1),P(2),… ,使 得 在 阶段 P(0) 最 多 有 个 页 面 缺失 ,而 对 所 有 i 宇 1, 在 阶段 P(i) 恰 有 
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个 页 面 缺失 。 这 个 阶段 划分 容易 得 到 。 事 实 上 ,只 要 从 尾部 开始 扫描 内 存 访 问 请 求 序列 
0 二 0o(1) ,co(2),… ,olm) ,每 遇 到 有 个 页 面 缺 失 就 截取 到 一 个 新 的 阶段 。 

下 面 要 证 明 最 优 离线 算法 OPT 在 每 个 阶段 P( 让 至 少 产生 1 个 页 面 缺失 。 

由 于 在 初始 状态 下 算法 LRU 与 算法 OPT 有 相同 的 高 速 缓存 , 故 当 算法 LRU 在 阶段 
P(0) 产 生 第 1 个 页 面 缺失 时 ,算法 OPT 也 产生 了 1 个 页 面 缺失 。 

对 于 阶段 PG) ,i 三 1, 设 ol(t;) 是 阶段 PG(i) 的 第 1 个 页 面 访问 请 求 ,o(ti4i 一 1) 是 阶段 
PCD) 的 最 后 1 个 页 面 访问 请 求 , 晶 p 是 阶段 P(i 一 1) 的 最 后 1 个 页 面 访问 请 求 。 可 以 证 明 
阶段 PO 让 中 有 个 不 同 于 p 的 互 不 相同 的 页 面 访问 请 求 。 

事实 上 , 当 算 法 LRU 在 阶段 PO) 产生 个 页 面 缺 失 的 页 面 访问 请 求 互 不 相同 且 不 同 
于 p 时 ,结论 显然 成 立 。 否 则 ,可 分 两 种 情况 讨论 如 下 。 

(1) 算法 LRU 在 阶段 PG(i) 对 页 面 访问 请 求 g 产生 两 次 页 面 缺失 。 

设 算法 LRU 在 阶段 P(7) 对 页 面 访问 请 求 o(51)==g 和 o (ss) 二 gq 产生 页 面 缺 失 , 且 访 乏 
$1 过 ss 全 tit1 一 1。 在 算法 LRU 对 页 面 访问 请 求 o(s1) 二 g 产生 页 面 缺 失 后 ,被 调 人 高 速 组 
存 。 此 后 在 页 面 访问 请 求 o(s,)==g 又 产生 页 面 缺失 ,这 说 明 页 面 g 在 o(s1) 后 的 某 次 页 面 访 
问 请 求 oa() 被 调 出 高 速 缓 存 , 且 si 二 1 二 s, 。 当 页 面 g 被 调 出 高 速 缓存 时 , 它 是 当前 高 速 缓 存 
中 最 近 访问 时 间 最 早 的 页 面 。 因 此 ,内 存 访问 请 求 子 序列 cCs ) ,…',c(i) 包含 了 k 十 1 个 不 
同 的 页 面 访问 请 求 , 即 有 个 不 同 于 p 的 互 不 相同 的 页 面 访问 请 求 。 

(2) 算法 LRU 在 阶段 P(i) 产 生 页 面 缺失 的 页 面 访问 请 求 互 不 相同 ,但 有 1 次 在 页 面 
访问 请 求 p 产生 页 面 缺 失 。 

设 在 页 面 访问 请 求 o(1)==p 且 1 宇 t; 时 页 面 p 被 调 出 高 速 缓存 。 与 前 面 类 似 的 论证 可 
知 ,内 存 访问 请 求 子 序列 o(1; 一 1) ,c(t;),… ,a(t) 包 含 了 k 十 1 个 不 同 的 页 面 访问 请 求 , 即 有 
k 个 不 同 于 p 的 互 不 相同 的 页 面 访问 请 求 。 

通过 上 面 的 讨论 可 知 ,p 蚌 阶 段 P(i 一 1) 的 最 后 1 个 页 面 访问 请 求 , 因 此 ,在 阶段 PC) 
开始 时 ,页 面 p 在 高 速 缓存 中 。 而 在 阶段 P(i) 中 又 有 个 不 同 于 p 的 互 不 相同 的 页 面 访问 
请 求 。 由 此 可 见 任何 一 个 算法 在 阶段 P(i) 都 至 少 产生 1 个 页 面 缺 失 , 最 优 离线 算法 OPT 
也 不 例外 。 这 就 证 明了 Ciru(o) 三 kCopr (0) , 即 在 线 算 法 LRU 的 竞争 比 为 k。 

通过 类 似 的 分 析 可 以 证 明 在 线 算法 FIFO 的 竞争 比 为 上 。 

进一步 分 析 表明 ,在 线 算法 LRU 和 FIFO 是 最 优 在 线 算 法 。 换 句 话说 ,如 果 算 法 A 是 
页 调度 问题 的 在 线 算 法 , 且 算法 A 的 竞争 比 为 a, 则 a 三 。 

设 S 二 {pi1,ps，…,pr+1) 是 任意 & 十 1 个 页 面 组 成 的 集合 。 不 失 一 般 性 可 设 在 初始 状态 
下 算法 A 与 最 优 离线 算法 OPT 有 相同 的 高 速 缓存 。 对 于 内 存 访问 请 求 序列 o, 在 线 算法 A 
的 耗费 为 Ca(o) ,最 优 离线 算法 OPT 的 耗费 为 Copr (oc)。 考 查 下 面 的 内 存 访问 请 求 序列 c。 
o 的 每 个 页 面 访问 请 求 都 使 该 页 面 不 在 A 的 高 速 缓存 中 。 所 以 算法 A 在 o 的 每 次 页 面 访问 
请 求 时 都 产生 1 个 页 面 缺失 。 而 对 于 最 优 离线 算法 OPT 来 说 ,对 o 的 每 次 页 面 访问 请 求 
ca(b) ,算法 OPT 总 可 以 选择 调 出 当前 高 速 缓存 中 的 页 面 p, 使 得 p 不 在 后 续 的 & 一 1 次 页 面 
访问 请 求 c(t 十 1),… ,alt 十 k 一 1) 中 。 因 此 ,对 任何 连续 次 页 面 访问 请 求 ,算法 OPT 最 多 
产生 1 个 页 面 缺 失 。 也 就 是 说 ,Cs(c) 二 Corr(c) 。 
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11.3 势 函数 分 析 


势 函 数 分 析 法 是 在 线 算法 竞争 分 析 中 的 一 个 重要 方法 。 在 分 析 在 线 算法 A 的 竞争 比 

时 ,通常 需要 证 明 存 在 非 负 常 数 a, 使 得 

Cal(o) ZaCopr(o) 人 卫生 
对 任何 在 线 请 求 序 列 c=c(C1),c(2),…,cCz) 都 成 立 。 其 中 ,CaA(c) 是 算法 A 的 耗费 ，Corr 
(o) 是 最 优 离线 算法 OPT 的 耗费 。 

设 对 每 个 具体 的 在 线 请 求 (7) ,1 二 + 三 m, 算 法 A 的 耗费 为 Ca (1) ,最 优 离线 算法 OPT 
的 耗费 为 Copr (t+)。 式 (11.1) 蕴 含 在 平均 情况 下 有 Ca (1) 三 aCopr (7) ,1 三 t 过 mm。 因此 ,可 以 
用 势 函 数 方 法 对 算法 A 的 耗费 进行 分 摊 分 析 (amortized analysis) 。 

给 定 在 线 请 求 序列 o==o(1) ,co(2),… ,olm) 和 势 函 数 $B, 算 法 A 对 每 个 具体 的 在 线 请 求 
o(1) 的 分 摊 在 线 耗费 定义 为 Cs(i) 十 G(D) 一 G( 一 1) ,1 三 tz 三 m。 其 中 ,@B(7) 是 回答 在 线 请 求 
ol() 后 势 函数 的 值 ,8(1) 一 B(1 一 1) 是 回答 在 线 请 求 o(1) 过 程 中 势 函 数值 的 变化 。 

在 分 挫 分 析 中 通常 要 证 明 对 任何 o(z) 有 

Ca(D) + B01) — Bt—1) 入 acCorr(Ct) Ci 2 

证 明了 式 (11. 2) 就 容易 得 出 算法 A 的 竞争 比 是 a。 事 实 上 ,将 式 (11.2) 的 左右 两 端 对 

所 有 1 志 1 志 m 相 加 得 到 


和 Ca) + Bm) — BO) <o> Copr (2) ria 
通常 选取 的 势 丽 数 是 非 负 丽 数 ， 且 @(0) 一 0。 由 此 可 从 起 (11. 3) 得 到 ,对 任何 在 线 请 求 
序列 o==o(1) ,a(2),…,olm) 有 > Cw <a> Copr (t), 即 Ca (0) aCorr (0) 。 


势 丽 数 分 析 法 的 难点 是 构造 恰当 4 的 势 函 数 并 证 明 式 (11. 2)。 下 面 以 在 线 页 调度 算法 
LRU 为 例 说 明 势 函数 分 析 法 在 在 线 算法 竞争 分 析 中 的 具体 应 用 。 

页 调度 问题 的 输入 是 内 存 访问 请 求 序列 o==o(1) .co(2),… ,olm)。 在 任何 时 刻 , 设 算法 
LRU 的 高 速 缓存 中 的 页 面 集合 为 Siru ,最 优 离线 算法 OPT 的 高 速 缓存 中 的 页 面 集合 为 
Sopr, 且 S= Sigu— Sopr。 

对 Siru 中 页 面 按 其 最 近 访问 时 间 从 小 到 大 排序 为 pi ,ps，… .ps。 定 义 每 个 p; 的 权 为 
w(pi) 二 i,1<i<k。 由 此 定义 势 函 数 为 $B 二 2) w(p)。 


pES 


考查 任意 内 存 访问 请 求 c(z) 一 户 。 不 失 一 般 性 , 设 算法 OPT 先 回答 访问 请 求 。 如 果 算 
法 OPT 没有 产生 页 面 缺 失 , 则 其 耗费 为 0, 且 势 函 数 没有 变化 。 如 果 算 法 OPT 产生 页 面 缺 
失 , 则 其 耗费 为 1。 此 时 算法 OPT 将 高 速 缓存 中 的 一 个 页 面 调 出 从 而 使 势 函数 值 增 加 。 一 
次 调 出 最 多 使 势 函 数值 增加 。 

算法 LRU 在 回答 访问 请 求 o(7) 二 p 时 ,如 果 没 有 产生 页 面 缺 失 , 则 其 耗费 为 0, 且 势 函 
数 没 有 变化 。 如 果 算 法 LRU 产生 页 面 缺失 , 则 其 耗费 为 1。 此 时 算法 LRU 将 高 速 缓存 中 
的 一 个 页 面 调 出 从 而 使 势 函 数值 减少 。 在 算法 LRU 回答 访问 请 求 o(7) 二 p 之 前 ,页 面 pb 在 
OPT 的 高 速 缓存 中 ,而 不 在 LRU 的 高 速 缓 存 中 。 由 对 称 性 可 知 ,此 时 必 有 一 页 面 g 在 
LRU 的 高 速 缓存 中 ,而 不 在 OPT 的 高 速 缓存 中 。 如 果 算 法 LRU 将 页 面 g 调 出 高 速 缓存 ， 


个 法 设计 与 分 析 ( 第 4 版 ) 


则 势 函 数值 减少 w(g) 三 1; 否则 ,由 于 页 面 p 调和 高速 缓存 将 使 ww(g) 的 值 减 少 1, 从 而 使 势 
函数 的 值 至 少 减 少 1 。 

综 上 所 述 ,算法 OPT 每 产生 1 次 页 面 缺 失 使 势 函数 值 最 多 增加 ;算法 LRU 每 产生 1 
次 页 面 缺 失 使 势 函 数值 最 多 减少 1。 由 此 可 得 ,Ciru (四) 十 B(7) 一 B(1 一 1) 二 RkCopr (1)。 也 就 
是 说 ,算法 LRU 的 竞争 比 为 。 


11.4 天 服务 问题 


在 11.1 节 中 提 到 的 & 服 务 问 题 是 在 线 算法 设计 的 一 个 经 典 问题 。 在 一 般 情况 下 ,k 服 
务 问题 的 输入 是 位 于 距离 空间 V 中 & 个 位 置 的 & 个 服务 ,以 及 距离 空间 V 中 的 服务 请 求 序 
列 o 二 ol1),o(2),…,olm)。 当 前 个 服务 要 按 服务 请 求 序列 提出 请 求 的 先后 次 序 响 应 每 
个 服务 。 对 服务 请 求 o(i) 的 响应 就 是 从 当前 的 个 服务 中 选取 一 个 服务 j ,从 六 的 当前 位 置 
移动 到 服务 请 求 (i) 的 位 置 。 对 服务 请 求 a( 让 的 响应 的 耗费 是 服务 j 移动 的 距离 。 服 务 请 
求 是 在 服务 过 程 中 一 个 接着 一 个 地 给 出 的 。 也 就 是 说 ,每 一 时 刻 只 知道 在 此 之 前 的 服务 请 
求 序列 。 问 如 何 调度 比较 节省 ,即使 个 服务 在 服务 过 程 中 移动 的 总 距离 较 短 ? 

上 述 & 服务 问题 描述 中 的 距离 空间 V 是 一 个 点 集 以 及 定义 在 该 点 集 上 的 一 个 距离 函 
数 4:(VXV) 一 R, 且 满足 如 下 性 质 : 

(1) d(u,v)0, YuvEV。 

(2) qd(Cuyu) 一 0 兮 x 一 V。 

(3) d(u,v)=d(v,u), Vu v€EV, 

(4) dusv) td(v,w)d(u,w), Yu wEV, 

在 11.1 节 中 提 到 的 服务 问题 是 当 距 离 空间 V 是 一 个 有 个 顶点 的 图 G, 即 |V|=n 
的 特殊 情形 。 其 中 ,G 的 每 条 边 的 长 度 为 正 数 , 且 满 足 三 角 不 等 式 。 

事实 上 ,11. 2 节 讨 论 的 页 调度 问题 也 是 & 服务 问题 的 特殊 情形 。 在 页 调度 问题 中 将 高 
速 缓存 中 的 & 个 页 面 看 作 & 个 服务 。 当 产生 页 面 缺 失 时 ,高速 缓 存 中 的 页 面 与 低速 内 存 中 
页 面 的 交换 看 作 1 次 移动 服务 ,其 耗费 为 1。 因 此 ,页 调度 问题 是 & 服务 问题 中 所 有 不 同 点 
对 间距 离 均 为 1 的 特殊 情形 。 


11.4.1 竞争 比 的 下 界 


在 11.2 节 中 已 证 明 页 调度 问题 在 线 算法 竞争 比 下 界 为 k。 这 个 结论 可 以 推广 到 服 
务 问题 在 线 算法 。 

设 有 服务 问题 的 在 线 算法 A 的 竞争 比 为 a, 则 a 三 k。 

下 面 针对 在 线 算法 A 构造 一 个 特殊 的 服务 请 求 序列 so 二 (1),o(2),…,olm) ,以 及 k 个 


在 线 算法 A1,As，,…,A, 使 得 Ca(a) 宇 > Ca (c) 。 由 此 推出 存在 算法 Ai,1<<i<&k, 使 
Ca(o) 宇 kCa(o) 宇 kCoer(o)。 从 而 > 人 。 
设 距离 空间 V 中 有 十 1 个 点 , 即 |V|==& 十 1。 初 始 时 个 服务 位 于 不 同位 置 ,另外 还 


有 一 个 空位 置 。 根 据 算法 A 构造 服务 请 求 序列 so 二 co(1).o(2),…,olm) 如 下 。 服 务 请 求 
ol 让 发 生 在 V 中 未 被 & 个 服务 占据 的 空位 置 h 处 。 


在 线 算 法 说 计 
对 于 1 过 /过 m, 设 o() 一 zsz41 是 最 终 未 被 算法 A 的 上 个 服务 占据 的 空位 置 。 由 此 可 . 
得 , Ca(o) = 六 dzrz) 一 d(zisxH1)o 章 


t=1 


设 ysya ss ys 是 初始 时 算法 A 的 & 个 服务 占据 的 位 置 。 构 造 算法 A; 如 下 ,其 中 1 过 
i 全 k&。 初 始 时 算法 A; 的 个 服务 占据 V 中 除了 外 的 个 位 置 。 对 于 服务 请 求 6(1) 一 z， 
如 果 算 法 A; 的 空位 置 为 zx,, 算 法 就 将 位 于 zx,_1 处 的 服务 移动 到 zx, 处 ,否则 不 做 任何 事情 。 

设 Vi 是 算法 A; 的 & 个 服务 占据 的 点 的 集合 ,1 三 i&。 可 以 证 明 在 响应 服务 请 求 c 一 
o(1) ,co(2),… ,alm) 的 整个 过 程 中 ,V; 互 不 相同 。 由 此 可 知 ,对 任何 服务 请 求 o(7) 二 zx, 只 有 
一 个 算法 A; 需要 响应 服务 请 求 。 因 此 有 


大 更 m—l 
2) Cu(o = >)d(zrioz) = 2) driszm) 
i=1 t=2 =1 


大 
Ca(o) = 2 CD +Td(zorzor) > 6 (0) 


下 面 对 服 务 请 求 顺序 用 数学 归纳 法 证 明 ， 在 响应 服务 请 求 v 一 o(1),o(2),…,olm) 的 整 
个 过 程 中 V; 互 不 相同 。 初 始 时 结论 显然 成 立 。 设 在 服务 请 求 c(t 一 1) 时 结论 成 立 。 考 查 服 
务 请 求 o(1) 二 zx,。 此 时 xz,-1E€Vj,1<j&。 对 任意 两 个 不 同 集合 V; 和 Vi,1<j,l&。 由 
于 Vj; 和 Vi 不 同 ,x 不 可 能 同时 不 属于 V; 和 V,。 如 果 zx,EV; 且 xz,EVi, 则 响应 服务 请 求 
o() 二 x 后 V; 和 Vi 都 没有 改变 ,从 而 仍然 不 同 。 如 果 zx, Vj; 且 zx,EVi, 则 响应 服务 请 求 
ol 四) 二 zt 后 有 Zz-1 儿 Vj; 且 zx-1EVi, 即 V; 隆 Vi。 由 数学 归纳 法 即 知 所 述 结论 成 立 。 

目前 对 服务 问题 的 一 些 特殊 情形 找到 了 竞争 比 为 k 的 在 线 算法 ,但 在 一 般 情况 下 还 
没有 找到 竞争 比 为 k 的 在 线 算法 。 计 算 机 界 普 遍 猜 测 距离 空间 中 的 服务 问题 存在 竞争 比 
为 k 的 在 线 算法 。 这 个 猜测 称 为 服务 猜测 。 


11.4.2 平衡 算法 


& 服务 问题 的 平衡 算法 的 基本 思想 是 让 每 个 服务 移动 的 总 距离 尽 可 能 平衡 。 

用 y; 表示 服务 i 所 处 的 位 置 ,D; 表示 服务 i 已 经 移动 的 距离 。 在 响应 服务 请 求 c(z) 一 
zt 时 ,平衡 算法 选取 服务 j, 使 D; 十 d(y; ‘7) = min{Dit dlyisz,) ) ,并 将 服务 j 移动 到 了 ,。 

可 以 证 明 , 当 |V|=k 十 1 时 ,平衡 算法 是 竞争 的 。 

事实 上 , 设 V 中 & 十 1 个 点 为 zi ,ra,…，,zti。 对 于 服务 请 求 序列 c= 二 o(1) ,ol(2),…， 
olm) 平 衡 算 法 B 的 耗费 是 Cs(o) ,最 优 离线 算法 OPT 的 耗费 是 Copr(c), 则 有 

Ca(c) 和 MKCopr(c) 十 R na, {dz ,7;)} 

由 此 可 知 ,平衡 算法 B 的 竞争 比 为 。 

如 果 条 件 |V| = 二 =k 十 1 不 成 立 , 则 不 能 保证 平衡 算法 B 是 竞争 在 线 算法 。 

例如 ,考查 当 &=2 且 |V| 二 4 时 服务 问题 的 一 个 简单 实例 如 下 。 

设 图 G 是 有 4 个 顶点 a,b,c.d 的 一 个 矩形 ,如 图 11-2 所 


示 。 其 中 ,d(a,6)==d(c,d)=a, d(b,c)==d(a.d)=B, 有 a “ 万 
次 服务 请 求 需 要 移动 距离 8, 而 最 优 离线 算法 OPT 响应 每 次 4b c 


服务 请 求 只 需要 移动 距离 <。 由 此 可 见 ,Cs(o)/kCopr (oc) 一 图 11-2 平衡 算法 的 实例 
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co , 即 平衡 算法 B 不 是 竞争 在 线 算法 。 
对 平衡 算法 B 做 适当 修改 如 下 。 用 y; 表示 服务 i 所 处 的 位 置 ,D; 表示 服务 i 已 经 移动 
的 距离 。 在 响应 服务 请 求 (7) 二 zx, 时 ,选取 服务 j, 使 得 
Di 十 dyiyzr) = min(D: 二 2d(yi,x.)} 
并 将 服务 j 移动 到 工 ,。 
可 以 证 明 按 此 修改 后 的 平衡 策略 的 在 线 算法 , 当 &=2 时 的 竞争 比 为 10。 


11.4.3 对 称 移动 算法 


& 服务 问题 的 对 称 移动 算法 的 基本 思想 也 是 希望 每 个 服务 移动 的 总 距离 尽 可 能 平衡 ， 
所 采用 的 策略 是 对 称 移动 策略 。 

首先 考查 直线 上 的 服务 问题 。 此 时 ,距离 空间 V 中 的 点 都 是 同一 条 直线 L 上 的 点 。 
初始 时 个 服务 位 于 直线 L 上 的 k 个 不 同 的 点 。 在 任何 时 刻 用 sy ,ss，… ,ss 表示 个 服务 
在 直线 L 上 的 位 置 。 服 务 请 求 序列 co 二 o(1) ,co(2),…,ol(m) 是 直线 LL 上 的 m 个 点 。 

在 响应 服务 请 求 o(1) = 二 z, 时 ,对 称 移动 算法 A 采用 如 下 对 称 移动 策略 : 

(1) 当 z 位 于 2 个 服务 %s 和 s; 之 间 时 ,服务 s; 和 s; 同时 向 z, 移动 距离 4 一 min {1s; 一 
welslss—= a }e 

(2) 当 所 有 个 服务 位 于 xz, 的 同一 侧 时 ,选取 距 zx, 最 近 的 服务 ;; ,将 服务 s; 向 zz, 移动 
距离 d=|s; 一 xz,|。 

例如 ,对 图 11-1 中 的 例子 ,用 对 称 移动 算法 的 移动 总 距离 为 7。 

下 面 用 势 函 数 分 析 法 证 明 上 述 对 称 移动 算法 A 的 竞争 比 为 。 

设 对 称 移动 算法 A 的 & 个 服务 在 直线 L 上 的 位 置 为 s,s;,… ,si ,最 优 离线 算法 的 个 
服务 在 直线 L 上 的 位 置 为 ,ts，,…,t。 进 一 步 还 可 设 5 三 ss 三 … 全 $4 且 二 ts 三 … 全 th, 否 
则 可 对 服务 重新 编号 。 

对 服务 请 求 序列 c=c(1) ,ol(2),… ,olm) ,对 称 移动 算法 A 的 耗费 为 Ca(o), 最 优 离线 
算法 OPT 的 耗费 是 Copr(c) 。 设 对 每 个 具体 的 服务 请 求 (i) ,1 三 i 二 m, 算 法 A 的 耗费 为 
C4 (站 ,最 优 离线 算法 OPT 的 耗费 为 Copr (2)。 


定义 势 函 数 中 D3 |#—s |+ 2 si)。 

不 失 一 般 性 ， 设 对 任意 服务 请 求 oC 算法 OPT 先 响应 服务 请 求 , 接 着 由 算法 A 响应 
服务 请 求 。 算 法 OPT 响应 服务 请 求 之 前 势 函 数 的 值 为 8;_, ,OPT 响应 服务 请 求 之 后 势 函 
数 的 值 为 @,, 算 法 A 响应 服务 请 求 之 后 势 函 数 的 值 为 @;,1 达 i 过 m。 算 法 OPT 响应 服务 请 
求 后 势 函数 值 的 增 量 为 a; 二 GB; 一 8B 1 ,算法 A 响应 服务 请 求 后 势 函 数值 的 减 量 为 ,一 到 一 
@;。 下 面 证 明 对 于 1 入 ;i 生 ,有 


a: < kCorpr (i) (11.4) 
B: 宇 Ca(i) (11.5) 


设 B= 委 二 9, 本 SH s1,0 2 Sis 
算法 OPT 响应 服务 请 求 6 站 二 时 ， 服务 移动 到 ,其 耗费 为 Copr (让 二 15 一 yi|。 亚 二 


在 线 算法 朗 计 


D3 | 一 一 s | 的 值 最 多 增加 Copr (站 ,而 98 == 之 (5 一 5) 的 值 不 变 , 从 而 ,a; 志 RCopr (2)。 11 


设 算法 OPT 响应 服务 请 求 6(7) 二 y; 后 服务 4 移动 到 vi, 然后 由 算法 A 响应 服务 请 求 本 
o( 站 三 y;。 下 面 分 两 种 情况 。 

情况 1: 算法 A 的 所 有 服务 在 w 的 同一 侧 。 

不 妨 设 算法 A 的 所 有 服务 在 y; 的 右 侧 。 此 时 距 y; 最 近 的 服务 是 s, 。 显 然 有 之 上 0 。 


按照 算法 A 的 对 称 移动 策略 ,将 服务 % 移动 到 y; ,其 耗费 为 CCGD) 一 | 一 w|。 why It 
5 | 的 值 减少 了 ACAGD) ,而 9= 》) (5 一 5) 的 值 增 加 了 (4 一 DCO, 从 而 B=C4 (2)。 


情况 2: y; 位 于 服务 s, 和 si 之 间 , 即 5, 二 y; 过 s+1。 
不 妨 设 s, 距 y; 较 近 。 按 照 算法 A 的 对 称 移动 策略 ,将 服务 s, 移动 到 y; ,同时 服务 w+ 


向 y; 移动 相同 距离 ,其 耗费 为 CCD) 一 2|w 一 w|。 此 时 ,更 一 >) | 4 一 s; | 中 只 有 第 > 项 


和 第 x 十 1 项 发 生变 化 。 如 果 此 时 算法 OPT 的 服务 满足 j 志 7, 则 亚 的 第 r 项 减少 k|s, 一 
yi| ,而 第 7 十 1 项 最 多 增加 1s, 一 yi|。 当 jr 十 1 时 , 亚 的 第 7 十 1 项 减少 k|s, 一 yi| ,而 第 > 
项 最 多 增加 |s, 一 y;|。 可 见 在 这 两 种 情况 下 , 亚 的 值 不 增 。 

再 考查 9 = >) (5; 一 %) 值 的 变化 。 由 于 服务 s, 和 ,1 的 移动 ,使 6 值 增加 


ic 


| rw 一 i| [一 (一 十 Cr 一 1) 一 (Cr) 十 (一 (r 十 1))] 2 总 
由 此 可 见 ,B 宇 Ca (2)。 
根据 已 证 明 的 式 (11.4) 和 式 (11.5) 可 得 
a = $B — Bo < kCopr (1) 
一 有 = ®— $<— Cl) 
= $, — B, < kCorr (2) 
—B = ® 一 和 入 一 CA(2) 


| CaG) 


an = $, 一 G < khCopr m) 
—B, = $B, — $, <— Cam) 
将 上 述 不 等 式 相 加 得 


到 ,一 @@ 一 Copr (i) 一 py (eA) 


由 于 @B, 宇 0, 故 by Ca(i) <4> Copr (i) + Bo, 即 Ca(o) SRCopr (0) + Bo 


由 服务 请 求 序列 2 二 o(1) ,oc(2),… ,ol(m) 的 任意 性 即 知 ,算法 A 的 竞争 比 为 k。 

对 称 移动 算法 还 可 推广 到 距离 空间 是 树 的 情形 。 在 这 种 情形 , 树 中 任意 两 点 x 和 y 之 
间 的 距离 是 树 中 连接 x 和 y 的 简单 路 的 长 度 , 记 为 d(z,y)。 

初始 时 个 服务 位 于 树 上 的 个 不 同 的 点 。 在 任何 时 刻 用 51 ,ss,… ,ss 表示 上 个 服 
务 在 树 上 的 位 置 。 服 务 请 求 序列 c=c(1) ,oe(2),… ,olm) 是 树 荆 上 的 m 个 点 。 在 响应 服 
务 请 求 s(t) 二 zx, 时 ,如 果 连 接 服务 s; 和 zz, 的 简单 路 上 没有 别 的 服务 , 则 称 服务 s; 为 有 效 服 
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务 ;否则 , 称 服务 s; 为 无 效 服务 。 
在 响应 服务 请 求 o(1) 二 zx, 时 ,对 称 移动 算法 A 采用 如 下 对 称 移 动 策略 : 让 所 有 有 效 服 
务 s; 以 相同 的 速度 向 zx, 移动 ,直至 
(1) 服务 s; 到 达 zx,。 
(2) 由 于 其 他 有 效 服务 的 移动 ,使 ;; 成 为 无 效 服务 。 
具体 算法 可 描述 如 下 : 
public static void A(int j) 
{ 
while (lcovered(j)) 
{ 
double d = mind(j)， 


activemove(j, d); 


} 


在 算法 A 中 ,在 响应 服务 请 求 o(j)= 二 zj 时 ,由 mind(j) 计 算出 
d= min(ld(si,yi) | s: € act(j), y: € vert(si,x;)} 

其 中 ,act(j) 是 响应 服务 请 求 o(j) 二 zx 时 ,所 有 有 效 服务 组 成 的 集合 ;vert(s;,zj) 是 树 工 中 
连接 服务 ;; 和 xz, 的 简单 路 上 本 的 项 点 和 zz, 组 成 的 集合 。 

然后 由 activemove(j, d) 让 所 有 有 效 服务 s; 向 xz, 移动 距离 4。 此 时 有 些 有 效 服务 变 成 
无 效 服 务 。 重 复 上 述 过 程 直至 covered(j)., 即 已 有 服务 移动 到 xz,。 

容易 看 出 ,算法 A 是 直线 上 的 & 服务 问题 的 对 称 移 动 算法 的 直接 推广 。 用 与 前 面 讨论 
类 似 的 方法 可 以 证 明 算法 A 的 竞争 比 为 &。 

设 对 称 移动 算法 A 的 & 个 服务 在 树 T 中 的 位 置 为 5 ,ss,… ,si ,最 优 离线 算法 OPT 的 
个 服务 在 树 工 中 的 位 置 为 ,ts,…,t。 由 此 可 以 定义 一 个 带 权 二 分 图 G 如 下 。s1 ,so ,sk 
对 应 于 图 G 中 的 顶点 vi ,vas wp; tz，… ots 对 应 于 图 G 中 的 顶点 zx。G 中 边 
(Vist) 的 权 为 d(si5tj) ,1 二 i,j 三 k&。 设 Ma 是 图 G 的 一 个 最 小 权 匹 配 ,| Maa | 为 其 权 值 。 
定义 势 函 数 B= 二 有 | Ms | 十 > d (si5,)。 


不 失 一 般 性 , 设 对 任意 服务 请 求 oa(i)。 算 法 OPT 先 响应 服务 请 求 ,接着 由 算法 A 响应 
服务 请 求 。 算 法 OPT 响应 服务 请 求 之 前 势 函 数 的 值 为 @-, ,OPT 响应 服务 请 求 之 后 势 函 
数 的 值 为 B;, 算 法 A 响应 服务 请 求 之 后 势 函 数 的 值 为 8;,1 达 i 过 m。 算 法 OPT 响应 服务 请 
求 后 势 函 数值 的 增 量 为 a; 二 6B; 一 8B;_1 ,算法 A 响应 服务 请 求 后 势 函 数值 的 减 量 为 8; 二 @; 一 
@;。 与 直线 情形 类 似 ,可 以 证 明 , 对 于 1 二 i 过 mm, 式 (11.4) 和 式 (11.5) 成 立 。 

从 而 Ca(o) 三 RCopr(o) 十 B。。 由 服务 请 求 序列 o 二 ao(1),o(2),…,olm) 的 任意 性 即 知 ， 
算法 A 的 竞争 比 为 。 


11.5 Steiner 树 问题 


假设 有 一 个 石油 开发 公司 在 一 片 荒漠 中 勘探 地 下 石油 。 荒 漠 中 原来 没有 任何 道路 , 开 
发 公司 必须 在 勘探 过 程 中 逐步 建立 连接 所 有 已 探 明 油井 的 道路 系统 。 建 设 道路 的 费用 与 道 
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路 的 长 度 成 正比 。 每 探 明 一 处 油井 就 要 用 最 少 费 用 建 一 条 连接 当前 道路 系统 的 新 路 。 开 发 
公司 应 如 何 修建 满足 要 求 的 道路 系统 ? 这 个 问题 的 模型 就 是 本 节 要 讨论 的 在 线 Steiner 树 
问题 。 
依次 给 出 欧 几 里 得 平面 (简称 欧 氏 平面 ) 上 个 点 的 序列 ww ,ww。 在 线 Steiner 树 
问题 要 求 按照 个 点 的 顺序 依次 建立 连接 已 知 点 的 平面 连通 图 ,使 总 长 度 尽 可 能 短 。 
在 线 Steiner 树 问 题 的 一 个 简单 的 贪心 算法 描述 如 下 : 
public static void greedy(point v[j]) 
{ 
point u = closest(v[j]); 
addCuyv[j])， 
上 


设 算法 greedy 在 给 出 第 i 个 点 v; 时 构造 的 树 为 T;,1 三 i 三 n。 当 给 出 第 j 个 点 wv 时 ， 
算法 greedy 先 由 closest(Cz[7 门 ) 计 算出 T_; 中 距 w 最 近 的 点 4 ,然后 将 边 (u,wv;) 加 入 T-! 构 
成 新 树 T;。 

当 closest(v[)]) 计 算出 的 是 六- 的 顶点 wuw ,ui 中 距 最 近 的 点 wx 时 ,算法 
greedy 构造 的 是 一 棵 支撑 树 ,此 时 也 称 算法 greedy 为 顶点 贪心 算法 。 

下 面 讨论 算法 greedy 的 竞争 比 。 

设 对 于 给 定 的 输入 序列 mw ,vs,…,v ,最 优 Steiner 树 的 长 度 为 1, 则 算法 greedy 产生 的 
边 中 长 度 大 于 21/k 的 边 数 小 于 人 。 

事实 上 , 设 使 算法 greedy 产生 长 度 大 于 2L 人 的 边 的 点 的 集合 为 S, 则 S 中 任何 两 点 之 
间 的 距离 大 于 2L/k。 由 此 可 知 ,S 中 点 组 成 的 平面 完全 图 G 的 最 短 Hamilton 回路 的 长 度 
大 于 |S121/k。 因 此 ,G 的 最 优 Steiner 树 的 长 度 s 大 于 1S1l1/k&。 另 一 方面 ,由 SE {wi， 
vo， vs} 可 知 G 的 最 优 Steiner 树 的 长 度 ;最 多 为 1, 即 1S11/k 二 s 夺 1。 由 此 可 得 |S|<k。 

通过 上 面 的 讨论 即 知 ,算法 greedy 构造 的 树 中 第 大 的 树 边 的 边 长 最 多 为 21/k。 因 此 


T, 的 总 长 为 | T, | 过 》) 21k =OClogn)。 可 见 算法 greedy 的 竞争 比 为 O(logn)。 


目前 已 知 的 在 线 SS 树 算法 竞争 比 的 下 界 是 Q(logn/loglogn)。 这 个 下 界 可 以 通过 
构造 一 个 特殊 的 输入 序列 c= 二 vi ,vs，,… ,vw 来 证 明 。 
o 的 所 有 点 分 布 在 一 个 网 格 上 。 设 xz 三 2 是 一 个 正 整数 , 且 n= 二 x”。 当 nn 宇 16 时 ,zz 之 


去 (logn/loglogn)。 输入 a 的 所 有 点 分 成 x 十 1 层 。 每 一 层 的 点 都 在 一 条 长 度 为 n 的 水 平 线 
段 上 等 距 分 布 。 第 i 层 上 分 布 的 点 的 坐标 为 (jai,b),0 三 ix,0j 达 n/a;。 其 中 ,a 二 


zi 二 0 时 扩 二 0; 当 i 辽 0 时 所 一 六 ws 。 特 别 地 ,am 一 mas 一 1。 对 所 有 第 站 层 与 


第 ;十 1 层 间 的 距离 是 ci 二 bi 一 b; 王 ait1。 第 i 层 上 分 布 的 点 数 为 1 十 n/ai, 因 此 ,所 有 点 
数 为 


加 3 
> (E+1) > (Rt+!) 二 上 2 十 元 十 On) 


i=0 i=0 


输入 o 所 有 点 的 分 布 如 图 11-3 所 示 。 
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图 11-3 特殊 的 输入 序列 
对 于 上 面 构造 的 输入 序列 ,可 以 构造 一 可 支撑 树 如 图 11-4 所 示 。 第 层 的 点 与 其 水 平 
邻 点 相连 ,其 他 层 的 点 与 其 垂直 邻 点 相连 。 这 棵 树 的 总 长 度 是 二 吕 。 (2+ 1) = 
n+2n/z 过 3n 。 因 此 ,关于 此 序列 的 最 优 Steiner 树 的 长 度 /<3n。 


Te 


图 11-4 特殊 输入 序列 的 支撑 树 


如 果 按 照 ;一 0,1, ,zj 一 0,1,…,z/ai 的 次 序 给 出 5 的 所 有 点 , 则 可 以 证 明 任 何在 线 
算法 构造 出 的 树 的 总 长 度 至 少 为 nr/8。 由 此 可 见 , 对 于 输入 序列 ec 任何 在 线 算法 的 耗费 与 


最 优 离线 算法 耗费 的 比值 至 少 是 号 久 - 车 > 高 (logx/loglogn) 。 也 就 是 说 ,在 线 Steiner 树 


算法 竞争 比 的 下 界 是 Q(logn/loglogn) 。 


11.6 在 线 任务 调度 


假设 要 用 m 台 完 全 相同 的 机 器 来 完成 加 工 任务 序列 c 一 万 ,J， 。 加 工 任务 是 一 
个 接着 一 个 到 来 的 。 当 任务 J 到 来 时 已 经 知道 它 需要 的 加 工时 间 p ,1 二 kn。 在 线 任 务 
调度 问题 要 求 在 m 台 机 器 上 安排 这 个 加 工 任务 ,使 总 完成 时 间 最 短 , 即 从 第 1 个 任务 开 
始 加 工 到 所 有 任务 都 完成 所 经 历 的 时 间 最 短 。 

可 以 设计 解 在 线 任务 调度 问题 的 贪心 算法 Greedy 如 下 。 

设 在 任何 时 刻 第 7 台 机 器 上 最 近 已 经 安排 的 任务 的 完成 时 间 为 1t; 。 当 任务 J 到 来 时 ， 
选取 机 器 i, 使 得 ;二 加 也， 仿 }。 将 任务 J 安排 在 机 器 i 上 进行 加 工 。 

下 面 分 析 算 法 Be 的 竞争 比 。 
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设 对 于 任意 加 工 任务 序列 c 一 Ji ,Jaz,…,J ,算法 Greedy 的 总 完成 时 间 为 Te(c) ,最 优 
离线 算法 OPT 的 总 完成 时 间 为 Torr(c) 。 进 一 步 设 算法 Greedy 安排 了 全 部 任务 后 "一 max 
{| 二 t,1 志 j 志 mm} , 即 在 时 刻 r 所 有 m 台 机 器 上 都 有 加 工 任务 ,此 后 就 至 少 有 1 台 机 器 空 
闲 。 如 果 按 照 算法 Greedy 的 安排 ,最 后 完成 的 任务 是 J , 则 按照 算法 的 贪心 策略 任务 J 
在 时 刻 t:<r 开始 。 因 此 ,任务 J 的 加 工时 间 至 少 是 Te (o) 一 r。 由 此 可 知 , max (pi) 二 
pr 宇 Te(o)—r。 

另 一 方面 ,显然 有 

元 旺 Pi 宇 r, Torr (co) 之 max{ 坝 > pr max{pi} | 


因此 ， 


n 


人 过 于 
l<i<n 7 


1 >) p+ max{pi} 


ee 1<i<n 
过 2max (> pmax{p'} |< 21ota) 
i=1 ei 
由 此 可 见 ,算法 Greedy 的 竞争 比 为 2。 实 际 上 更 精细 的 分 析 表 明 算 法 Greedy 的 竞争 
比 为 2 一 二。 


11.7 负载 平衡 


负载 平衡 问题 与 在 线 任务 调度 问题 有 些 相似 。 给 定 的 是 m 台 完 全 相同 的 机 器 和 加 工 
任务 序列 oc 二 了 ,J，。,…,J,。 加 工 任务 是 一 个 接着 一 个 到 来 的 。 当 任务 J 到 来 时 不 知道 它 
需要 的 加 工时 间 , 但 知道 它 的 权重 wi ,1 志 & 三 n。 设 在 任何 时 刻 t, 第 i 台 机 器 的 负载 , 即 已 
经 安排 在 第 i 台 机 器 上 的 所 有 加 工 任务 的 权 之 和 为 1;() ,1 三 i 三 mm。 在线 负载 平衡 问题 要 
求 在 m 台 机 器 上 安排 这 n 个 加 工 任务 ,使 各 机 器 的 负载 尽 可 能 平衡 , 即 在 安排 加 工 任务 过 
程 中 的 机 器 最 大 负载 达到 最 小 。 

设 对 于 任意 加 工 任务 序列 o 二 了 ,J,,…,J,, 最 优 离线 算法 OPT 的 最 大 负载 为 Topr 
(o) 。 在 下 面 讨论 的 在 线 负载 平衡 算法 A 中 ,变量 工 志 Topr (co)。 在 任何 时 刻 t, 当 1;(1) 宇 
VmL 时 , 称 机 器 i 的 负载 较 重 ;否则 , 称 机 器 i 的 负载 较 轻 。 

当 任务 J 到 来 时 ,在线 负载 平衡 算法 A 修改 变量 L 的 值 为 


L= max Lu 二 (zx 十 六 “0 
i=1 


如 果 此 时 还 有 负载 较 轻 的 机 器 ,就 选择 一 台 负 载 较 轻 的 机 器 i, 将 加 工 任务 J 安排 给 机 
器 i。 如 果 此 时 所 有 机 器 都 负载 较 重 ,就 选择 最 近 变 成 负载 较 重 的 机 器 i, 将 加 工 任务 J 安 
排 给 机 器 i。 


首先 注意 到 ,按照 算法 A 的 选择 策略 ,在 任何 时 刻 最 多 有 |v 万 | 台 负 载 较 重 的 机 器 。 

事实 上 ,如 果 有 多 于 | v 万 | 台 负 载 较 重 的 机 器 , 则 所 有 机 器 的 负载 总 和 将 超过 
1v 砚 |V 砚 >>xL。 而 由 变量 二 的 定义 有 zL 过 ws 十 > 5400， 即 zi 是 所 有 机 器 的 负载 总 
和 的 下 界 。 由 此 发 生 矛 盾 。 
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另 一 方面 ,在 算法 A 的 执行 过 程 中 变量 了 保持 性 质 L Torr (o)。 事 实 上 ,由 ws 过 
Tor( 和 二 (mw 十 六 50) < Tor(o), 容易 用 数学 归纳 法 证 明 <Torr(o)。 
ar 


下 面 讨 论 算法 A 的 竞争 比 。 设 算法 A 的 最 大 负载 为 TA(c) 。 

首先 证 明 在 任何 时 刻 + 有 LD|IVm|(L 二 Topr (0)) ,1<i<m。 

如 果 机 器 i 负载 较 轻 , 则 不 等 式 显 然 成 立 。 设 机 器 i 负载 较 重 ,日 to 是 机 器 i 变 成 负载 
较 重 机 器 的 最 近 时 刻 。 进 一 步 设 M(zo) 是 在 时 刻 1 时 负载 较 重 , 且 变 成 负载 较 重 机 器 的 最 
近 时 刻 不 晚 于 tt 的 所 有 机 器 的 集合 。 显 然 ,iE M(to)。 设 S 是 在 时 刻 to 以 后 分 配给 机 器 i 
的 所 有 加 工 任务 的 集合 。 所 有 S 中 的 任务 显然 只 能 分 配给 M(to) 中 的 机 器 。 设 j= |M(to) 
| , 则 显然 有 Tom(o) 三 je 。 下 面 分 两 种 情况 讨论 。 

情况 1: j 委 |Vm| 一 1。 

设 加 工 任务 J, 使 机 器 i 从 负载 较 轻 变 成 负载 较 重 , 则 由 vw 三 Topr (o) 知 40 过 
[Vm lL tt Sw Sl Vm + Ton(o)), 


情况 2: j=|Vm|。 
此 时 应 有 4;(w) 二 1YmlL, 因 车 不 然 ,全 部 机 器 的 总 负载 将 超过 mL。 由 此 可 知 , 1;(7) 过 
| Vm lL+ 2 we S| Vm | (LTom(o)) 。 
JES 


综 上 所 述 可 得 
Ta(o) = max {1(D} S| Vm | (L+HTom(0)) <2 | Vn | Tom(o) 
[人 


其 中 ,是 算法 A 完成 所 有 任务 的 时 间 。 换 句 话说 ,算法 A 的 竞争 比 是 2| Vm|。 
小 结 


本 章 通过 实例 讨论 在 线 算 法 设计 的 基本 方法 。 

页 调度 问题 是 系统 软件 设计 中 提出 的 一 个 基本 问题 ,其 输入 是 内 存 访 问 请 求 序列 。 在 
线 页 调度 算法 回答 内 存 访 问 请 求 时 并 不 知道 后 续 内 存 访 问 请 求 的 任何 信息 。 本 章 讨 论 了 几 
种 常见 的 在 线 页 调度 策略 : LIFO 算法 、FIFO 算法 、LRU 算法 和 LFU 算法 ,以 及 这 些 在 线 
算法 的 竞争 性 。 

服务 问题 是 在 线 算法 设计 的 一 个 经 典 问题 。 本 章 曾 述 了 k 服务 问题 的 在 线 算法 的 竞 
争 比 下 界 。 同 时 ,还 讨论 了 kk 服务 问题 的 平衡 算法 和 对 称 移动 算法 。 

对 于 在 线 Steiner 树 问题 ,在 线 任务 调度 问题 和 负载 平衡 问题 ,用 本 章 介 绍 的 基本 算法 
设计 出 具有 较 高 竞争 性 的 在 线 算法 。 


习 题 


11-1 证 明 对 任何 非 负 常数 a, 在线 算法 LFU 都 不 是 a 竞争 的 。 
11-2 多 读 写 头 磁盘 问题 的 在 线 算法 。 磁 盘 上 的 磁道 是 按照 同心 圆 划分 的 。 在 一 个 多 读 


< 


3 
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写 头 磁盘 系统 中 有 个 磁头 读 取 磁 盘 上 存储 的 数据 。 当 系统 接收 到 一 个 数据 访问 请 
求 时 ,系统 要 在 线 确 定 由 哪 一 个 磁头 来 读 取 数 据 。 试 设计 一 个 完成 上 述 任务 的 在 线 
算法 ,并 分 析 算 法 的 竞争 比 。 

在 带 权 页 调度 问题 中 ,高 速 缓 存 中 的 个 页 面 编 号 为 1,2,…,k, 将 低速 内 存 中 的 一 
个 页 面 调和 高速 缓存 i 的 费用 为 w;。 试 设计 带 权 页 调度 问题 的 在 线 算法 ,并 分 析 算 


法 的 竞争 比 。 
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穷 举 搜索 法 exhaustive search method 51 

时 间 复 杂 性 time complexity 10 

完全 n 叉 树 complete mary trees 131 

完全 二 叉 树 ”complete binary trees 62 

完全 多 项 式 时 间 近 似 格式 ”complete polynomial-time approximation 


八 


团 


备忘录 算法 memorization algorithms 57 

表 list 43 

抽象 数据 类 型 ”abstract data types 2 

单 源 最 短路 径 single source shortest path 85 

迭代 回溯 iterative backtracking 118 

迭代 搜索 iterative search 319 

顶点 覆盖 vertex cover 232 

非 确定 性 图 灵机 non-deterministic Turing machine 222 
货物 储 运 问题 freight transport problem 294 

空间 复杂 性 space complexity 10,11,61,160,222 

拉 斯 维 加 斯 算法 Las Vegas algorithms 190,205,206 
势 函数 protential functions 329 

欧 几 里 得 算法 Euclid’s algorithm 210 

会 伍德 算法 Sherwood algorithms 190,197 

贪心 算法 greedy algorithms 85 

贪心 选择 性 质 greedy selection property 88 

图 的 mm 着 色 m-coloring of graphs 138 

图 灵机 Turing machine 222 

线性 时 间 选 择 linear time selection 33 


斗 
号 


背包 问题 “knapsack problem 75 
重 倒 子 问 题 overlapping sub-problems 55 
重组 算法 reconstruction algorithm 304 
带 权 拟 阵 weighted matroid 107 

带 权 区 间 最 短路 weighted interval shortest path 306 
费 尔 马 小 定理 Fermat’s theorem 215 

哈 夫 曼 编码 Huffman code 92 
哈密 顿 回 路 ”hamiltonian cycle 224 

活动 安排 activity arrangement 85 

和 矩阵 连 乘 ”matrix chain multiplication 50 
类 class 6 


240 


词汇 圭 绚 


前 驱 predecessor 157 

前 缀 码 prefix code 93 

树 结构 tree structures 114 

指数 时 间 算 法 exponential time algorithms 210 
十 画 

递归 recursion 10 

递归 回溯 recursive backtracking 117 

根 root 62 

流水 作业 调度 machine shop schedule 72 

旅行 售货员 traveling salesman 116 

素数 测试 primality testing 214 

效率 efficiency 2 

效率 分 析 efficiency analysis 149 

离线 算法 off line algorithms 325 

竞争 分 析 competitive analysis 326 

竞争 比 ”competitive ratio 326 

圆 排 列 问题 “circles permutation problems 142 


+ 一 珈 
符号 三 角形 sign triangles 128 
前 枝 函 数 ”pruning function 117 
排列 permutation 18 
排列 树 ”permutation trees 119 
排序 sorting 2 
十 二 画 


程序 program 1 

集合 覆盖 set covering 244 

棋盘 覆盖 chess board cover 26 

散 列表 hash table 258 

随机 数 ”random numbers 33 

最 长 公共 子 序列 longest common subsequence 58 
最 大 团 maximum clique 136 

最 大 子 段 和 maximum sum of subsequence 288 
最 大 子 矩阵 和 maximum sum of sub-matrix 291 
最 短 加 法 链 ”shortest addition chain 318 

最 接近 点 对 closest point pair 35 

最 小 生成 树 ”minimum spanning trees 99 
最 小 相 容 树 ”minimum compatible trees 304 

最 优 二 叉 搜索 树 ”optimal binary search tree 80 
最 优 次 序 optimal order 52 


算法 设计 与 分 折 ( 艇 了 版 ) 


最 优 解 optimal solution 49 
最 优 前 缀 码 optimal prefix code 93 

最 优 三 角 剖 分 optimal triangulation 61 
最 优 子 结构 “optimal substructure 52 
最 优 装载 optimal loading 91 

装载 问题 load problem 91 


概率 方法 probabilistic method 150 

路 径 压 缩 ”path compression 313 

数据 类 型 data types 2 

数据 结构 data structures 2 

数值 概率 算法 “randomized numerical algorithm 190 
算法 algorithm 1 

算法 复杂 性 ”algorithm complexity 10 

算法 设计 策略 algorithm design strategy 61 
算法 优化 ”algorithm optimization 288 

跳跃 表 skip list 200 

整数 规划 integer programming 75 

整数 因子 分 解 integer factor decomposition 209 
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